雲計算

數據庫自治服務DAS發佈年度新版本:1-5000,”數據庫自動駕駛“進入規模化時代

阿里云云盒更多內容https://yqh.aliyun.com/live/cloudbox

2020年4月,阿里雲數據庫自治服務DAS 正式發佈,開啟數據庫“自動駕駛”新時代。經過一年的時間,數據庫自治服務DAS的輔助自治模式已經支持阿里雲全網100%的高可用實例,並且已經有超過5000的客戶,運行在DAS的自治模式,即授權DAS進行數據庫的自修復、自優化、自運維和自安全。

 

讓數據庫發揮最優的效能,依賴很多數據庫專業領域知識,對於大部分企業和應用開發者而言,依然充滿挑戰,如故障診斷,快速定位根因並進行有效的止損;業務快速迭代過程中的數據庫的持續調優、SQL Review等,都是非常耗時耗力且需要7x24小時值守的能力,因此,數據庫走向自治是一個必然趨勢。

 

如果說,傳統數據庫向雲數據庫的轉變是“汽車換馬車”,那麼DAS就是給“汽車”加上了“自動駕駛”的引擎,擁有了“自動駕駛”的能力。

 

在今天的發佈會上,針對用戶的核心痛點,DAS新發布了8大核心自治功能,包括7x24小時異常檢測、自動SQL限流、自動SQL優化、自動空間優化、自動彈性伸縮、智能調參、智能壓測、實時審計等,為企業的SQL問題、數據庫負載問題、空間問題、容量評估、安全審計,從異常發現、根因定位、自修復/自優化/自安全,既能實現快速止損,又會持續不斷的對數據庫進行優化,無需人工干預,讓企業像體驗“自動駕駛”一樣使用數據庫,數據庫管理成本降低90%。

SQL問題——以無人值守方式,實現數據庫持續優化

數據庫性能問題70%以上是SQL問題,但是傳統方案下面缺乏有效的止損手段,並且不具備提前預防、持續優化的可能性。

DAS通過異常SQL的定位、異常SQL自動限流、自動SQL優化、結果驗證,覆蓋解決SQL問題的各個環節,實現及時發現、快速止損、持續優化和可驗證。

640.jpg

數據庫負載問題——實現全鏈路自動彈性伸縮,應對業務負載變化

對於絕大多數企業來說,數據庫都是主幹系統,數據庫負載飆升,會對業務造成巨大的損失,但是基於閾值的告警方式,存在異常發現延遲大的問題,往往不能在負載發生變化的時候,快速發現並及時採用止損措施。

DAS的7x24小時異常檢測,可以1分鐘內檢測到數據庫異常,並且支持全鏈路自動彈性伸縮(包括帶寬、Porxy、CPU/內存/IO、節點等等),能夠快速解決數據庫負載問題,保障業務持續可用。

640-1.jpg

空間問題——數據庫空間問題的自修復、自優化

數據庫空間問題,影響著數據庫的性能和成本,DAS針對數據庫常見的空間問題,提供了完整的“治標”+“治本”的自修復、自優化方案,節省數據庫使用成本的同時,提升數據庫的性能。

640-2.jpg

DAS全方位自治能力 助力企業用戶發揮數據庫最優效能

隨著數據時代的來臨,各個企業在業務高速增長的過程中都會不可避免地遇到數據庫種類繁多、數據監測困難、運維成本高昂等常見數據庫運維痛點。過去一年中,DAS已與5000+企業建立合作,為其提供專業且高效的數據庫管理服務。我們以知名 “AI+教育”上市公司英語流利說和知名企業服務提供商用友用友為例,為大家展示DAS作為數據庫性能優化利器,如何破解用戶性能痛點,降低運維成本。

流利說流利說基於DAS構建了數據庫運維體系和工具。該體系針對全局workload,採用真實的業務流量和場景持續優化,完成自動跟蹤和回滾的流程閉環,實現自動SQL Review和自動優化,讓數據庫完成真正的”自治“。在操作流程上,DAS的標準化無感接入和監控流程,有效規避作業過程中人為遺漏及誤操作的可能性。

整套數據庫運維體系因DAS統一接入和管理、自動診斷、自動SQL Review和優化等特色,真正做到專業且高效,大大減輕了流利說DBA日常工作量。

流利說基礎架構負責人孫文傑表示:“DAS的引入使流利說數據庫整體性能得到優化,運維人效大幅提升,並幫助數據庫管理團隊從繁重的日常工作中釋放人力,實現團隊轉型升級。DAS幫流利說更聰明、更專業、更高效地使用數據庫服務。”

用友:DAS輕量級、個性化的智能壓測服務,幫助用友營銷雲使用真實業務場景和流量評估MySQL數據庫遷移到PolarDB的數據庫容量和兼容性。

在此過程中,DAS低負載捕獲真實業務流量、通過學習自動生成壓測流量、支持寫流量回放壓測和語法自動轉換,都有助於各項評估預見到可能存在的風險,多維度、高視角、全方位地為數據庫遷移保駕護航。

容量評估方面,更是在智能壓測期間根據業務需求精準評估了PolarDB規格,規避了潛在的性能風險,精準評估遷移實例規格,避免了不必要的IT資源浪費。

整個過程中,DAS一直為用友的數據庫遷移保駕護航,提前發現兼容性、性能風險,完成合理的容量評估。最終,順利完成數據庫遷移的業務規劃。

 

DAS誠摯邀你進入數據庫“自動駕駛”時代

僅僅用時一年,DAS便獲得了5000+客戶的信任,邁入數據庫“自動駕駛”時代。除去時代的需求,這份成功背後還有一些必然因素。

阿里巴巴內部紛繁複雜的業務場景、超過10萬的數據庫實例、快速迭代的業務、超級熱點“雙十一”等等,都給DAS提供了獨一無二、不可替代的“自動駕駛”訓練場,幫助DAS錘鍊自動駕駛的能力。雖然DAS在2020年才發佈,但其實早在2017年就開始研發了。在阿里巴巴內部,DAS經歷了3年不間斷的錘鍊,支撐了3個雙十一,自動優化了超過4900w的慢SQL,自動回收了4.6 PB的空間,自動優化了12%的內存。

此外,達摩院前沿研究的轉化,用戶業務類型的多樣性、數據庫的複雜性等等,都給數據庫的自動駕駛帶來了巨大的挑戰,其中很多問題對於專業的DBA都是難題,而DAS選擇了迎難而上,走在時代前面,預先解決一切問題。DAS由阿里雲和達摩院聯合研發,在異常檢測、SQL診斷、根因定位等等核心技術上面獲得了巨大的突破。過去3年,DAS相關研發團隊在數據庫國際頂級會議發表了4篇論文,包括SIGMOD、VLDB大會等。

在過去半年多的時間裡,DAS每天進行數千億次的異常檢測,進行至少20萬次以上的SQL診斷和優化,累計已幫助用戶自動處理10000+的故障,實現1分鍾發現、5分鐘定位、10分鐘止損,無需用戶人工干預,最大限度地保障數據庫持續可用的階段性目標。未來必將是數據庫全自治的時代,DAS也將持續以數據庫自動駕駛為目標,不斷為其增加自感知、自決策、自恢復、自優化和自安全的自治能力,為用戶和行業解決更深層次的需求。

相關閱讀:

深度技術揭祕 | 大促狂歡背後,如何有效評估並規劃數據庫計算資源?

重磅 | 數據庫自治服務DAS論文入選全球頂會SIGMOD,領航“數據庫自動駕駛”新時代

乾貨|SQL請求行為識別新功能上線,幫助解決異常SQL檢測之大海撈針問題

功能更新|DAS推出全局Workload優化功能,實現SQL自動診斷

乾貨|一文讀懂阿里雲數據庫Autoscaling是如何工作的

Leave a Reply

Your email address will not be published. Required fields are marked *