作者 | 阿里雲原生
在 6 月 9 日 2020 阿里雲線上峰會上,阿里雲智能基礎產品事業部高級研究員蔣江偉重磅發佈了雲原生裸金屬方案。
新一代容器服務 ACK,可以將最新神龍彈性裸金屬實例的強大性能發揮得淋漓盡致,具備極致性能、高效調度、全面安全的特點:
- 新一代神龍架構具備業界第一的 I/O 轉發能力,提供最高 100G 網絡帶寬;阿里雲高速 Terway 容器網絡通過網卡直通和數據平面加速,延遲下降 30%;
- 第 7 代實例最大支持 192 個 vCPU。ACK 智能 CPU 調度可以輕鬆釋放強大算力,無需應用調整可以實現 QPS 20~30% 提升;結合 ENI 網卡密度提升,可以縮減 50% 的計算成本;
- 彈性裸金屬實例支持阿里雲安全容器,提升端到端安全隔離能力,與開源方案相比性能提升 30%,也支持阿里雲首發機密計算容器,基於軟硬一體技術有效保護數據隱私。
在阿里巴巴內部,神龍架構已大規模應用於淘寶、天貓、菜鳥等業務,解決了高峰值下的業務性能和穩定性問題。在外部,尤其是在這次疫情影響下,很多企業面臨快速擴容的壓力,如在線教育行業,通過阿里雲容器+神龍方案,企業可以從容應對流量突增的難題。
視源股份(CVTE)的希沃系列教育平穩應對疫情期間指數級增長的課堂流量,視源電子運維負責人許坤豐稱,“疫情之下,希沃課堂作為教育信息化應用和服務工具提供商,免費向全國師生開放希沃雲課堂在線直播方案。不久前,全國超過 30 萬教師使用希沃雲課堂開課,共開設超過 200 萬節課程。面對指數級增長的流量,我們在阿里雲容器服務 ACK 上使用神龍服務器和 ECI,順利完成擴容,讓系統得以正常運行。ECI 的簡單易用,海量節點的特性加上神龍服務器高性能,零抖動的特點,極大緩解了擴容的壓力,讓我們把更多精力放在產品本身,給全國老師和學生提供更好的服務。”
雲計算開源產業聯盟上週公佈了“雲原生應用十大優秀案例”評選結果,阿里雲支持的申通通用雲原生計算平臺順利入選。申通基於雲原生裸金屬方案完成遷雲,實現了圍繞快遞包裹生命週期的高效管理,平穩度過 雙11 業務高峰。
雲計算開源產業聯盟對申通通用雲原生計算平臺評價稱“該平臺解決了傳統應用升級緩慢、架構臃腫、不能快速迭代等問題,通過雲原生架構體系,在成本、穩定性、效率、賦能業務等四個維度獲得顯著成效。目前核心業務系統已經在雲上完成流量承接,每天處理訂單量在千萬級別,處理物流軌跡在億級別,每天產生的數據量在 1T,使用 1300+ 個計算節點來實時處理業務。”
神龍架構是容器的最佳載體
2017 年 10 月,阿里雲在全球率先推出了同時融合物理機和虛擬機特性的“跨界”雲服務器——彈性裸金屬服務器神龍 X-Dragon,它採用了自主研發的虛擬化 2.0 技術,兼具“虛擬機的心臟”和“物理機的肌肉”,被認為是雲計算領域的新物種。從 2017 年發佈第一代神龍架構開始,歷經了軟件虛擬化、通用硬件虛擬化、專用硬件芯片虛擬化三個階段後,第三代神龍架構實現了裸金屬服務器、ECS 虛擬機,彈性容器實例 ECI 等多種計算平臺的架構統一和全面優化。
蔣江偉在演講中也提到,客戶普遍有個共識,那就是容器與物理服務器的結合是最佳搭檔。但是普通物理服務器天然具有一些缺陷,比如運維複雜度高,缺乏彈性。而以神龍架構為基礎的裸金屬服務器,搭配容器服務 ACK,不僅提供非常好的性能,同時具備虛擬機的運維靈活性,正好彌補了物理服務器的彈性缺陷,對於構建容器環境而言,裸金屬是更好的選擇。
據蔣江偉介紹,雲原生裸金屬具備極致的彈性、高效的調度能力和更全面的安全能力。在普通的應用場景下,基於神龍架構的容器服務ACK與自建容器相比,可以實現QPS提升30%,計算成本下降50%,容器安全性能提升30%。
對於線下傳統物理機服務器,企業客戶最大的痛點就是缺乏彈性,運維複雜,無法應對快速發展的業務需求。神龍裸金屬服務器,具備虛擬機的體驗,物理機的性能。擴容交付週期幾周縮短到分鐘,與虛擬機相比性能“零損耗”、“零抖動”,與傳統物理機相比性價比提升 20% ,是用戶上雲的最佳選擇。
釘釘以前 100% 部署在普通物理機上,疫情突發之後,政府、企業和學校對在線協作的需求猛增。通過雲上神龍裸金屬+容器彈性部署方案,快速地實現了釘釘業務應用 10 萬核擴容需求;藉助神龍+容器的超高性能支撐釘釘扛住了有史以來最大的流量洪峰。
此外,社區版本 K8s 容器調度技術存在一定侷限,無法充分使用神龍裸金屬服務器強大的算力。應用在多 CPU 核心場景下,可能會引起資源爭搶、CPU 頻繁切換等情況。通過開啟容器服務 ACK 的智能 CPU 調度,可以提升緩存的命中率、減少 CPU 中斷和切換次數,有效提升性能,在不增加硬件資源的情況下性能提升 20%,QPS 從 25 萬提升到 30 萬。
容器服務 ACK 不但支持對 CPU 的高效調度,還新增了對業界最強算力 AI 芯片 - 含光 800 的多核調度支持,可以成倍提升 AI 業務資源利用率和性價比。阿里自研的含光 800 芯片具備強大的應用算力,在淘寶的拍立淘場景中,對商品庫每天新增 10 億商品圖片,使用傳統 GPU 算力識別需要 1 小時,使用含光 800 後可縮減至 5 分鐘。對於強大的含光 NPU 芯片,阿里雲容器服務 ACK 獨創了面向容器的虛擬化和共享能力,充分發揮含光 800 多核資源,把多種業務精確調度到同一含光 800 芯片,充分利用計算資源,顯著降低計算成本!
傳統企業,尤其是一些大型企業,對從私有數據中心遷移到公有云上並不放心。其中數據安全問題是首要關切,需要獨享使用物理機才會有安全感。雲原生裸金屬方案,結合阿里雲安全沙箱容器技術,提供從基礎設施到應用運行時端到端安全,非常適合對隱私和隔離要求較高的應用場景,而且與開源方案相比性能提升 30%。
阿里雲此次首發機密計算容器,基於軟硬一體技術實現全鏈路加密,有效解決數據洩露、非法數據訪問等問題,可以應用在區塊鏈、金融交易、基因計算等業務場景中。
雲計算的下一站,是雲原生
神龍是面向雲原生設計的新一代雲基礎設施架構,同時支持裸金屬服務器、ECS 虛擬機,ECI 彈性容器實例等多種計算形態。神龍架構採用軟硬一體設計,可以將網絡和存儲的轉發任務卸載到神龍芯片上,避免了底層資源爭搶而導致的 ECS 虛擬機性能波動。第三代神龍架構還引入硬件級別 QoS 能力,為客戶關鍵業務帶來更強的保障。基於神龍架構的 ECI 彈性容器實例,性能優於虛擬機中運行的相同規格 Docker 容器;具備極致的彈性能力,可以在一分鐘內擴容 1000 業務容器實例。
客戶可以在一個 ACK K8s 集群中劃分不同節點池統一管理彈性裸金屬實例,ECS 虛擬機實例和彈性容器實例。根據應用負載特性,可以充分優化計算效率、提升資源利用率、降低計算成本。對於需要極致性能和強安全隔離場景,用戶可以採用裸金屬實例;對於存在明顯業務峰谷的場景,虛擬機實例可以提供更靈活的彈性。而彈性容器實例可以更好應對突發業務流量,提供免運維的用戶體驗。
容器服務 ACK 已經成為企業雲原生操作系統,與 EDAS 微服務架構,ARMS 端到端可觀測能力全面集成,全面提升 IT 敏捷性,為企業數字化轉型提速。
課程推薦
為了更多開發者能夠享受到 Serverless 帶來的紅利,這一次,我們集結了 10+ 位阿里巴巴 Serverless 領域技術專家,打造出最適合開發者入門的 Serverless 公開課,讓你即學即用,輕鬆擁抱雲計算的新範式——Serverless。
點擊即可免費觀看課程:https://developer.aliyun.com/learning/roadmap/serverless
“阿里巴巴雲原生關注微服務、Serverless、容器、Service Mesh 等技術領域、聚焦雲原生流行技術趨勢、雲原生大規模的落地實踐,做最懂雲原生開發者的公眾號。”