雲計算

申通完美支撐“雙11”——億級包裹背後的雲基礎設施

image.png

今年雙11,申通的系統前所未有的流暢與平穩

“雙11全站跑在阿里雲上,億級包裹洪峰過境,千萬級訂單毫秒級響應,系統穩如泰山。” 申通上雲的技術負責人方遙難掩驕傲地說。

“11月1日凌晨第一波訂單高峰到來,整個系統的響應很快,面對超過日常數倍的接單量,系統的響應時間沒有變化;在接單、自動化分揀、巴槍掃描、快件跟蹤等核心指標上表現穩定;相應的中間件、數據庫資源的負載也在合理的區間範圍內波動。”方遙在接受媒體採訪時表示。

這讓他對第二波訂單高峰信心滿滿,上雲後的申通系統沒有讓他失望。

11月6日,方遙盯著屏幕上穩定運行的後臺系統,像看自己的孩子。從8月進入雙11備戰,將近三個月的時間,經歷了無數次壓測,雙11第一波結束,才算輕鬆下來。作為申通上雲負責人,他長久的努力,也在此刻得到了最大的回報。

上雲前,申通使用線下機房作為計算及數據存儲平臺,一到雙11資源需求就膨脹,大促之後則閒置浪費;上雲後,幾乎全部的資源都是按量購買,用完雙11就釋放,真正做到了開箱即用,不產生一天浪費。與去年雙11當天相比,今年11月1到3日,相比此前傳統IDC架構方案,在業務量大幅提升的情況下,IT投入反而降低了30%。上雲的成效顯著。

全站應用容器化,彈性調度穩定高效

在設計全站上雲方案之初,方遙就果斷決定擁抱雲原生並將所有應用100%容器化,技術轉型的決策,是來自其強烈的危機感,2019年快遞行業業務量達到600億件,申通業務量達到73億件,開始向百億件規模挺進。

選用阿里雲容器服務ACK和容器鏡像服務ACR,可以為申通帶來兩大重要好處:業務快速上線、開箱即用的可靠彈性。

在這個快速多變的時代,企業業務“唯快不破”。通過雲原生技術可以做到快速上線部署,為團隊培養出應用開發與運維的規範化操作,形成了將應用代碼打包成容器鏡像再到K8s標準化部署的流程,不再需要耗費大量時間人肉發佈、也避免了因集群配置不一致而發生故障等問題,成功轉型DevOps驅動公司。

其次,快遞的業務是非常典型的週期性業務,在業務爆發式增長的時候,資源如何做到開箱即用?而業務突發增長,哪有比雙11更具代表的時期呢,今年雙11就是申通是彈性調度的絕佳試驗場。

當然容器與Kubernetes技術帶來的還有更多:依賴Kubernetes為核心的數據中心通過應用編排、業務故障自愈的能力讓整個系統更穩;通過監控埋點、業務日誌收集、鏈路監控等手段保證了在快速迭代過程中業務系統的穩定性;通過對計算資源的水位監測,結合業務的峰值情況,彈性擴縮容或降低配規格數量,可以降低整個資源的費用等等。

這個雲原生化全站遷雲的戰役,一場耗時一年有餘。

經過數不勝數的需求溝通與技術改造,在申通與阿里雲同學們的不斷努力下,申通最終成功實現採用雲原生技術和架構實現核心業務搬遷上阿里雲

這個決策,為今年雙11技術創新埋下了伏筆:比如,應用彈性伸縮大大降低計算成本,一年節省數百萬;又比如,快速上線更多創新業務,今年雙11的預售商品提前下沉到用戶附近,樓上下單樓下發貨,提升顧客體驗。

“上雲只是一個開端,雲只是基礎設施。”方遙說,“申通的技術架構會朝著下一代微服務架構Mesh演進,提升複雜系統的可治理性。”

阿里雲神龍裸金屬方案,支撐申通平滑渡過雙11

申通核心業務系統原架構基於 VMware+Oracle 數據庫進行搭建。隨著搬遷上阿里雲,架構全面轉型為基於 Kubernetes 的雲原生架構體系。其中,引入雲原生數據庫並完成應用基於容器的微服務改造是整個應用服務架構重構的關鍵點。

綜合考慮申通實際業務需求與技術特徵,最終選擇了「阿里雲 ACK+ 神龍裸金屬 + 雲數據庫」的雲原生解決方案,實現核心應用遷移上阿里雲。

1.png

阿里雲ACK+神龍裸金屬方案,於2020年609雲峰會上重磅發佈。申通雲原生上雲的基礎設施,就全部使用了阿里雲的神龍裸金屬服務器。相較於一般雲服務器(ECS),Kubernetes 搭配神龍服務器能夠獲得更優性能及更合理的資源利用率且雲上資源按需取量,對於擁有大促活動等短期大流量業務場景的申通而言極為重要。

2.png

首先,雲原生裸金屬方案,可以滿足業務快速發放和彈性的要求。神龍裸金屬服務器可分鐘級完成實例創建和啟動,並利用Kubernetes的調度和編排能力,通過阿里雲容器K8S服務與阿里雲基礎設施的緊密協同(SLB, VPC, NAS, SLS等等),在非常短的時間內,支持業務極速部署,輕鬆應對瞬時峰值場景對系統敏捷性的要求。

第二, 神龍裸金屬的性能,加上容器的彈性,形成了天作之合。“容器+神龍裸金屬”的解決方案非常契合像雙11這種大流量、高併發的場景。

神龍裸金屬是雲原生的最佳載體,它規格較高,可以實現高密度容器部署。同時,神龍服務器的性能優勢明顯, 它完全消除了虛擬化損耗,提升8%的計算性能,其類物理機特性,可進行二次虛擬化。新一代容器服務 ACK,可以將最新神龍彈性裸金屬實例的強大性能發揮得淋漓盡致。

數據顯示,容器運行在雲上神龍反而比非雲物理機的性能要好10%-15%。因為神龍雲服務器不僅無虛擬化開銷,而且運行在神龍上的每個容器都可以獨享彈性網卡ENI,能提升13%的網絡吞吐量。

結語

如果說,快遞行業上半場的競爭拼的是規模、服務乃至價格,進入下半場,快遞企業們還需要比拼硬核的技術實力。

阿里雲基礎設施首次支撐申通全站業務系統,申通的雙11平穩順滑,展現了無限潛力。

在申通內部看來,“雙11”的逆襲也意味著被申通稱為數字化1.0的階段全部完成。在技術的最終規劃中,跨過2.0達到達數字化3.0,必須構建起一個申通大腦,這個大腦不僅包攬一切,還可以自我迭代,是申通智能人格的終極象徵,這才是申通自動化轉型的終極目標。

參考文章:
雙11即將開啟第二波 申通跑在阿里雲上怎麼樣?

迎戰超長待機“雙11” 申通為何選擇數字化轉型這劑猛藥?

申通快遞全面遷移阿里雲 成快遞全面上雲第一家

阿里雲發佈雲原生裸金屬方案:裸金屬+容器,解鎖雲計算的新方式

停課不停學,阿里雲“神龍+容器”幫助在線教育企業構建高質量課堂

[申通和民生銀行入選信通院雲原生應用十大優秀案例,揭祕雲原生與數據中臺的正確打開方式](https://www.infoq.cn/article/oWfvN7RruZ1Jg5MsR1U8
)

Leave a Reply

Your email address will not be published. Required fields are marked *