4月22日,阿里雲正式對外發布了首個“自動駕駛”級數據庫平臺DAS,無疑是數據庫領域的又一重磅事件。
為什麼說憋了很久?因為很早前,阿里雲就確定了雲原生、智能化兩大方向,在雲原生數據庫領域,阿里雲擁有國內首個雲原生數據庫PolarDB及雲原生數據倉庫AnalyticDB等,如今,其在智能化方面也取得了新的突破,相關研究成果已連續兩年入選數據庫領域頂級會議VLDB。
而大招也並非筆者標題黨,可能很多人並不清楚DAS這個產品發佈,背後意味著什麼。作為全球前三、亞太第一的雲服務商,阿里雲此次發佈DAS,必將拉開雲上數據庫進入自動駕駛時代的序幕。
據悉,目前,阿里巴巴集團內部85%的數據庫實例已經實現自動駕駛。
DAS的前世今生
眾所周知,雖然雲數據庫解決了開發者在資源彈性、高可用、備份、監控等基本運維負擔,讓數據庫最優性能觸手可及。
但如何用好數據庫,如何讓數據庫更穩定併發揮最優的性能?如何快速診斷和應對各種原因導致的突發數據庫性能問題?以及如何以最低資源成本滿足業務需求,這些問題一直都是用戶非常重要的訴求,因此,DAS應運而生。
DAS是一種基於機器學習和專家經驗實現數據庫自感知、自修復、自優化、自運維及自安全的雲服務,提供六大自治特性,從異常檢測、根因分析、決策執行以及跟蹤評估,擁有全閉環的自治能力,其過程無需人工干預,實時評估自治優化效果,持續反饋,持續優化。
從上圖,我們可以清晰的看到DAS的演進過程,其雛形最早可以追溯到2014年的CloudDBA SQL診斷引擎,2016年進行了升級,但那時候還只是一個輔助診斷工具,還談不上自動駕駛。2017年,確定自動駕駛方向,通過阿里巴巴集團豐富的業務場景進行孵化和錘鍊。2019年,在阿里雲上正式發佈數據庫 “自動駕駛”級平臺——數據庫自治服務DAS。
如何正確理解DAS
與Oracle將自治能力內置在數據庫引擎中不同,DAS(Database Autonomy Service,簡稱DAS)並不是一個數據庫,而是一個數據庫“自動駕駛”平臺,因此,其並不僅作用於某單一數據庫引擎,而是作用於其數據庫產品家族中的所有數據庫,包括PolarDB、AnalyticDB、RDS、Redis等,涵蓋OLTPOLAPNoSQL等各種類型的數據庫。
而在“自動駕駛”工具類產品中,DAS處於怎樣的水平,與友商差異在何處?這裡需要先搞明白什麼是數據庫的“自動駕駛”,同為自動駕駛,其差別也可能巨大。目前,比較得到認可的數據庫自動駕駛等級定義如下:
Level-0:全部靠人肉,沒有任何工具/產品輔助
Level-1:提供基礎監控、告警等信息,不輸出任何建議;
Level-2:在某些場景下,能夠輸出診斷或者優化建議,但是建議是否採納和應用,還是由人來決策,例如SQL診斷引擎;
Level-3:在部分場景下,實現完全的自治,無需人蔘與,例如自動SQL限流、自動SQL優化、自動彈性伸縮等;
Level-4:實現數據庫的完全自動駕駛。
阿里雲資深技術專家、DAS產品線負責人李廣望在接受筆者採訪時候表示,目前DAS能力對應等級已經超越Level-3,正在全力向Level-4演進。
也就是說,DAS在部分場景下,已經實現了完全自治,無需人工參與。與友商的區別也就顯而易見。據悉,部分雲廠商的自治服務還處於輔助診斷階段,因為決策還需要人工採納和執行,這是根本的區別。
而部分場景比例是多少呢?李廣望表示,基於DAS在阿里巴巴集團內的實踐,能覆蓋90%的場景,讓數據庫管理成本下降9成。但阿里雲卻沒有將其定義為L4,是因為其優化策略採用最大保護策略,其目的是不給用戶帶來負面效果和不確定性。
據瞭解,目前,DAS已在阿里巴巴集團的所有數據庫上驗證了近3年,並大規模應用於阿里巴巴內部業務場景,累計優化超4200萬 SQL、回收超4 PB空間,並服務了大量電商、金融、遊戲等領域企業。
寫在最後
聊數據庫,不談性能就是耍流氓,因為,性能猶如糧食,在數據庫的歷史上,一直就不夠用,這就是為什麼數據庫都需要精細化調優的原因。
如果說,從傳統數據庫到雲原生數據庫,是數據庫領域的第一次飛躍,那麼,數據庫實現自動駕駛,毫無疑問是數據庫領域的第二次飛躍。因為,它讓數據庫發揮最優性能變得觸手可及。
從“人肉處理”到“自動駕駛”,從“被動救火”到“提前防治”,從“監控告警”到“自動止損”,從“局部優化”到“全局優化”,從“基於規則”到“基於AI”,代表的是時代的發展和技術的進步。
因此,阿里雲預測,未來3年,雲上80%的數據庫將開啟“自動駕駛“就變得很好理解了。從某種程度上講,雲數據庫實現自動駕駛的能力勢必會加速數據庫上雲的進程。
相關閱讀
阿里雲發佈“自動駕駛”級數據庫平臺DAS ,全球首創技術讓管理成本降9成