大數據

雲時代的智能運維平臺,助力企業創新迭代

每一起嚴重事故背後,必然有29次輕微事故和300起未遂先兆以及1000起事故隱患。—— 海恩法則(Heinrich‘s Law)

隨著雲計算時代的到來,大量企業將自己的業務逐步遷移上雲。雲計算的彈性,讓IT資源購買、擴容等更簡單。許多企業,已經不要花費巨大的人工時間,投入在IDC、服務器、網卡等物理資源的購買、擴容、升級等等。
但隨著信息時代的發展,業務在線化,業務系統服務客戶規模更大,系統的穩定變得更加重要。一旦出現故障,運維人員無法提前預警、以及無法最快時間內尋找出問題,極易影響到業務,造成巨大損失。
面對龐大的業務系統、多樣的服務模塊、海量的日誌與監控信息、極致的業務需求等,如何構建企業的快速、自動化、智能化、全週期的智能運維與預警系統,已經是企業競爭力的一部分。
因此,越來越多的企業開始搭建屬於自己的智能運維平臺,力圖減輕運維人員的負擔,以及更智能的故障預警、更快的響應。尤其是在這個業務上雲的時代,企業運維平臺的價值密集一直在升級,許多企業已經從基礎的資源購買維護中,升級到對業務價值的提升上。

4.png

由於泛日誌類數據的利用與分析,正在成為企業競爭力的一部分。研究報告表明,泛日誌類機器數據和規模快速增長,企業需要通過更加智能的運維平臺,來為業務提供參考。加之業務系統的時間價值密度逐漸加大,系統服務的客戶指數級增長,業務系統的複雜度和集群規模變得越大,因此一個穩定、高效且實惠的智能運維平臺逐漸成為一個企業安身立命的根本。
但是在搭建智能運維平臺時,我們又經常會遇到以下幾個挑戰:
1、海量日誌,如何快速分析告警:比如千億、萬億條日誌,如何實時查詢分析?如何確保實時穩定寫入?
2、系統複雜,數十個維度的數據,如何更高效地多維度分析?
3、如何抽絲剝繭,從中找的最重要的信息?比如,Error日誌有幾萬條,如何找到重要信息?
4、海量日誌長週期保存和處理流轉:從實時數據到歷史數據,如何滿足不同的分析模式和存儲要求?

5.png

阿里雲在這些年服務阿里巴巴經濟體、以及阿里雲客戶時,也遇到過許多這類的問題。阿里雲通過不斷打磨,推出了阿里雲日誌服務SLS,助力客戶構建智能運維平臺。
在9月18號雲棲大會上,阿里雲智能高級產品專家鏵劍為大家帶來了題為《雲時代的智能運維平臺日誌服務,助力企業創新迭代》的分享,在分享中詳細地介紹了阿里雲日誌服務SLS,是如何為用戶提供一站式的日誌採集、告警、存儲、分析以及可視化的能力,幫助企業的技術運維人員在雲時代,能夠基於SLS構建自己的智能運維平臺,快速分析系統狀態、洞察業務,助力企業的快速迭代和業務創新。

阿里雲日誌服務SLS,具備以下幾個優勢:
1、 秒級實時分析和告警:千億條日誌中,秒級返回10億條記錄
2、 多維度數據聯合分析能力:並提供高維查詢、實時分析、定時任務、可視化能力
3、 更深入細節洞察:從秒級細節、異常點位AI檢測、數據聚類來助力抽絲剝繭,發現重要信息

6.png

這些能力,幫助客戶對Logging、Metric、Tracing數據進行統一採集存儲分析,滿足業務監控、日誌分析、安全審計等要求,輕鬆解決如何快速、多維、深入細節分析的挑戰。
同時,SLS提供全週期的數據流轉能力,近期新發布的數據加工、數據投遞,可支持不同的分析模式、週期要求。利用數據加工,企業可以根據不同的分析要求,對數據進行規整、ETL。而利用數據投遞,企業可以滿足不同時間週期的數據處理方式、保存方式的數據流轉要求。

7.png

因此在這個業務上雲的時代,我們需要更智能的運維平臺,幫助我們的業務平穩、智能、高效地運行。我們堅信,基於阿里雲日誌服務SLS搭建,企業的智能運維平臺,能真正幫助到企業進行業務價值的創新迭代,助力企業客戶的業務,更穩定且快速地發展。

Leave a Reply

Your email address will not be published. Required fields are marked *