開發與維運

行業綜述 | 《阿里雲存儲白皮書》第一章

下一篇:技術產品 | 《阿里雲存儲白皮書》第二章

一、數字經濟時代已經到來

1、基礎設施的雲化

自人類社會誕生以來,先後經歷了農業經濟、工業經濟、網絡經濟等時代。今天,我們迎來了由IT經濟、DT經濟、智能經濟所組成的數字經濟時代。根據聯合國《2019年數字經濟報告》的統計,數字經濟的規模約佔全球生產總值的4.5%至15.5%之間,其中中國和美國是引領世界數字經濟發展的首要力量。正如水之於農業經濟時代,電之於工業經濟時代一樣,在數字經濟時代,數據正在成為新的自然資源、新的戰略資源。中國工程院院士、阿里雲創始人王堅在其《在線》一書中認為,數據正在改變商業的本質。
根據IDC的相關預測,全球數據圈將從2018年的33ZB增至2025年的175ZB,實現5倍以上的增長。預計到2025年,中國數據圈將增至48.6ZB,佔全球數據圈的27.8%。多方數據的匯聚以及對數據“存儲-使用-管理”的全生命週期支撐能力、全方位的數據安全體系和健全的數據生態環境、以數據為中心實現數據價值最大化是以存儲、計算、網絡等基礎設施所需要解決的重要問題。而今天,雲計算已經在關鍵技術和應用規模上實現對傳統基礎設施的超越,基礎設施全面雲化的進程已將開啟。

2、核心技術互聯網化

作為分佈式處理、並行處理和網格計算融合發展的雲計算從2006年正式誕生,時至今日,雲計算已經成為一門獨立的學科。今天,大數據、物聯網和人工智能等技術正在引領雲計算的發展。在各行各業不斷擁抱互聯網的當下,在企業組織數字化轉型的當下,在產業互聯網蓬勃發展的當下,需要更加適合互聯網場景的技術升級方案。從成立的第一天開始,阿里巴巴就具有了獨特的互聯網基因,在過去的二十年,阿里巴巴不斷應對互聯網時代的諸多挑戰,從而在今天構建起並梳理了數字經濟時代的底層範式和技術脈絡。
基礎設施的雲化需要一套新的技術體系,需要基於互聯網技術來進行改造。這其中最為明顯的例子就是對象存儲的興起,在最初就將存儲視為一種服務的對象存儲,在應對互聯網數據存儲的規模化、高增長等問題的時候,提出了具有劃時代意義的全新解決方案。對象存儲面向互聯網、移動互聯網而生,專為大量網頁、視頻、圖片、音頻等數據的存儲和管理等場景而設計。對象存儲採用基於互聯網的訪問接口,其本質是通過互聯網或移動互聯網訪問相關內容,為應用提供了全局、全網共享的數據池化管理,非常適合做為視頻、社交、音樂等互聯網應用的底層平臺。現在,對象存儲已經擁有了面向海量數據存儲、快速訪問的能力,不但可以構建數據統一分析平臺,還可以進一步挖掘數據的價值,讓存儲更智能。
互聯網經濟的蓬勃發展很大程度上也源自於開源技術的繁榮。開放、開源是互聯網技術的重要基因。阿里巴巴是開源的受益者,也是開源的貢獻者。可以預見,下一代技術將構建在基於互聯網技術、開源技術、雲原生的雲化基礎設施之上,在這一過程中,阿里巴巴已經積累了豐富的經驗和最佳實踐,這套技術體系的可行性和先進性也已經被充分證明。

3、應用數據化和智能化

數據化和智能化是數字經濟的重要特徵,而云計算是應用數據化和智能化的有力保障。隨著技術的不斷髮展以及架構的不斷演化,雲計算簡化了傳統IT產品的供應鏈流程,提升了產品彈性。在實現了平臺和產品分離的同時,通過平臺升級帶動產品升級,實現了產品版本的快速迭代,使產品具備實時發佈和實時使用的智能化特徵。藉助“數據+智能”這個出口,雲計算將能夠根據不同企業和組織的規模、類型、行業等為其量身打造。萬事萬物都將被數字化,都會因為數字化而產生進一步走向全面智慧化、智能化的空間和驅動力。
在具體實踐中,數據智能服務已普遍應用在不同業務中來輔助人工決策。決策智能開始逐步代替人工,通過全流程智能化、自動化的升級,從輔助人工決策走向全流程自動化決策。以阿里云為例,在已經過去的以智能化為核心的2019年,阿里雲已經進入了一個全新的發展階段。以阿里雲存儲為例,在完成了以彈性擴展、靈活高效、降低成本為核心的存儲基礎服務以後,已經實現了支撐集團100%業務上雲的目標,同時還幫助越來越多的客戶實現數據管理的數字化和智能化。在針對不同業務場景上,阿里雲發佈了智能媒體管理視頻型實例,為雲上文檔、圖片、視頻提供一站式數據處理、分析、檢索等智能管理。阿里雲存儲不再是一個單一的底層平臺,而是升級為數據智能管理的平臺。

二、存儲行業的變革

1、存儲服務網絡的鉅變

雲計算讓原本離散的、依靠渠道實現分發的蒲公英網絡演進為具有更高的服務效率、迭代效率、發現效率、運營效率等四大優勢的平行網絡。這其中,自服務是雲計算核心的競爭力之一。傳統IT技術所構建的商業模式不再成立,雲計算的自服務能力讓企業可以像使用水和電一樣使用雲計算產品,在可管理性方面有了極大的提升,也避免落入依賴技術和產品外包的服務陷阱。從這個角度來說,相比於強調所有權的公有云,強調使用權的公共雲的概念其實更為貼切。
雲存儲是基於雲計算相關技術延伸和發展而來的全新的產品形態。本質上,雲計算不是一種計算,而是服務,雲存儲也不是一種存儲,而是一種基於存儲功能的服務。雲存儲的內核是應用軟件與存儲設備相結合,通過應用軟件來實現存儲設備向存儲服務的轉變。如同雲狀的廣域互聯網,雲存儲對使用者來講,不是指某一個具體的設備,而是指一個由多個存儲設備和服務器所構成的集合體。因此使用雲存儲時並不是使用某一個存儲設備,而是使用整個雲存儲網絡帶來的一種數字化服務。

2、雲原生對雲存儲的新要求

雲原生(Cloud Native)的概念在2015年開始被提及,主要包括容器、服務網格、微服務、不可變基礎設施和聲明式API等技術領域。雲原生計算基金會(Cloud Native Computing Foundation)認為雲原生技術有利於組織在公共雲、私有云和混合雲以及新型動態環境中快速構建和運行可彈性擴展的應用。
全面上雲的拐點已經到來:從單次購物節大促到日常業務運營,已經實現了常態化的上雲;從邊緣業務到核心鏈路和關鍵業務,已經實現了核心業務的上雲;從幾百臺機器到超過十萬臺機器,已經實現了規模化的上雲;從單一技術到全棧技術,已經實現了多樣化的上雲。上雲已經成為一種必然。除此之外,上雲不僅是業務需要面向雲端,研發同樣需要面向雲端。雲原生的出現讓業務獲得了更靈活的部署能力,同時也能夠挖掘出在線數據的更大價值。
雲原生應用對遷移性、擴展性和動態性的需求,對雲原生存儲也帶來了相應的密度、速度、混合度的要求,因此需要雲存儲不斷提高在效率、彈性、穩定、應用低耦合、安全等方面的能力。首先,雲原生存儲是面向應用的應用層存儲,是雲存儲在用戶接口和效率、易用性等優勢的集合;其次,雲原生存儲利用雲存儲基礎設施紅利,是構建在應用存儲之上的分層存儲;第三,雲原生提升了實現效率和自治方面的能力,提升了存儲穩定性,降低了安全隱患。

3、智能與存儲的交相輝映

人工智能技術的發展讓存儲產品在打破數據孤島,提升數據管理效率等方面有了更多可能。阿里雲提供了豐富的數據管理功能,通過數據分析挖掘數據價值。以阿里雲日誌服務的智能運維分析功能為例,該功能面向趨勢預測、異常發現、智能聚類和根因分析等四個場景,提升了DevOps分析和診斷的效率,幫助運維人員提前配置資源,提前預測、發現和解決突發故障。
藉助人工智能技術,阿里雲存儲產品在磁盤、服務與網絡的故障檢測中,可以更加準確地預測到故障的發生:在遇到網路抖動等異常狀況時,可以做到及時規避,大大減少長尾延遲現象;在業務調度中,利用人工智能技術,能夠提前進行負載均衡,避免熱點的不均衡;在數據的放置策略中,可以根據對冷熱數據的分析以及客戶訪問的規則與模式,將不同類型的數據進行分類,執行不同的置放策略,實現更加智能的分級存儲,從而提高總體系統效能。針對機器學習與人工智能計算的場景,阿里雲推出了高性能並行文件系統(CPFS:Cloud Parallel File System),並廣泛應用於智能駕駛、生命科學和基因計算等場景。為了應對圖片和視頻數據的快速增長,對數據進行智能分析成為剛需,阿里雲的智能媒體管理系統(IMM)將先進的分析算法與存儲相結合,通過簡單便利的調用接口,使得中小客戶也可以享用到阿里雲以及達摩院強大且先進的人工智能技術服務。

4、不可或缺的混合雲存儲

根據IDC的預測,到2021年,中國90%以上的企業將依賴於本地/專屬私有云、多個公共雲和線下數據中心的組合來滿足其基礎設施需求。同時,到2022年,50%的企業將部署統一的VMs、Kubernetes和多雲管理流程和工具,用以支持跨本地和公共雲部署的多雲管理和治理。同時,85%的大型企業管理者表示不會將所有數據只存儲在一個地方,會採用更多適合自身業務的存儲方法,即在混合雲環境中實現數據整個生命週期中的存儲與流轉。
通過混合雲IT架構無縫上雲已成為企業應用的新常態,混合雲存儲將成為架起本地數據中心和公共雲的橋樑,是傳統企業客戶上雲的新路徑。從新舊業務的融合到雲計算研發的混合部署,都離不開混合雲的支持。不同的系統,在不同的時間點所呈現的狀態也同樣不同,作為一種產品化的解決方案,混合雲可以說是公共雲、私有云、本地基礎設施部署優勢的一個結合。雲所提供的功能和業務越來越豐富,隨著容器等雲原生技術的發展,業務的跨雲部署也將更加便捷,在權限管理、靈活性、性價比方面表現出更大的優勢。目前,阿里雲在災備、網關、存儲陣列等領域先後推出混合雲解決方案,同時積極與夥伴展開合作,支持夥伴的數據平臺與阿里雲進一步的融合。

Leave a Reply

Your email address will not be published. Required fields are marked *