開發與維運

考拉海購全面雲原生遷移之路

image.png
今年 8 月底,入駐“阿里動物園”一週年的考拉海購首次宣佈戰略升級,在現有的跨境業務基礎上,將重點從以“貨”為中心變成以“人”為中心,全面發力會員電商。

外界不知道的是,對考拉海購來說,不只是完成了業務升級,目前考拉已全面擁抱雲原生,大幅提升運維效率,並加速業務的迭代升級。考拉海購技術負責人謝聘超在雲棲大會演講中分享了考拉海購的雲原生遷移之路,以下是演講內容整理。

今年年初,我們就完成了考拉全部遷移至阿里雲。但我們認為這還不夠,又給自己定了新的 KPI ,9 月之前讓所有的應用擁抱雲原生。
image.png

遷移融合,與時間賽跑

20億美元收購網易考拉,在阿里的收購歷史上,既不是最大,也不是最難的。但半年完成整合、未滿一年提出戰略升級,在阿里的歷史上從未有過。

快速的整合升級首先是由技術驅動的。

這一年多我們都在跟時間賽跑。

在遷移過程中,必須保證業務不受損、全部線上服務全程可用。但現實是,原機房距離太遠,導致每一次的網絡傳輸大概有 50 毫秒的延時,給不停服遷移帶來了巨大的困難。
image.png
當時想到了一個比較完美的解決方案,在機房間挖了一條光纖,並建立了考拉獨立的VPC,進行數據同步。既讓網絡流暢互通,又保證了數據安全。但是困難又來了。如果慢慢切換,流量先放 1% 、再放 5% 、再放 10% ,對於用戶體驗來說,損傷很大。試想,如果客戶下一個單需要3秒鐘,客服電話就要被打爆了。

疫情期間,考拉海購團隊緊急進行內測。把各個環節、所有的測試鏈路分批全部進行了測試,保證了整個鏈路的完整性。那個夜晚真的是提心吊膽。必須保證沒有灰度,才能做切換。

最終,考拉海購全量完成了遷移,性能沒有出現任何問題。整個遷移過程比較穩定順滑,到了阿里雲,雲網絡這塊也放心多了。

考拉海購 100% 全站遷移至阿里雲後,穩定支撐了今年 3.8 女神節大促。這是考拉遷移上雲後的首個大促,當天流量峰值較 2019 年雙 12 增長了 72% ,但相比之前成本大幅度降低。考拉海購各業務線也在當天被證明 100% 打通,形成閉環。

整個遷移過程中,阿里雲提供了很大的幫助。阿里雲 EPC 安全方案、數據遷移方案非常成熟。此外,阿里雲整體的能力支撐也很完整,遷移數據庫、 ES 的成本很低,沒有出現不兼容的情況。

阿里雲提供了一個很強的功能,叫有狀態的容器。以前的遷移是容器遷過來,IP地址就丟掉了。有了有狀態的容器,可以保持 IP 地址不變。此外,阿里雲產品提供了便捷的界面,可自助操作。這些產品優勢對效率提升和成本節約的價值極其巨大。

下一步,全面擁抱雲原生

完成了第一階段的目標之後,考拉海購開始了全面的雲原生之路。
image.png
雲原生幫助考拉海購在運維效率上有了大幅提升。雲原生產品提供了眾多 API ,可以基於產品的運維接口進行組合,開發出系統,整體運維變得非常靈活。

在彈性上,考拉海購主要關注兩方面,一是大促前後的彈性,二是白天高峰期和晚上低峰期的彈性。第一點比較常見,第二點藉助於阿里雲的彈性能力,也可以實現單日內的彈性收縮,對日常成本的節約非常有效。
image.png
在容災方便,阿里雲原生產品天然多 AZ 容災能力,極大地加速了考拉海購同城多活能力的建設,因此考拉海購才能在短時間內很快擴展到多機房,並具備多AZ的容災能力。

其次,基於 ARMS 和 PTS ,在業務不改造的情況下(個別特殊邏輯除外),就能完成全鏈路壓測能力的接入,增量業務也可以零成本接入全鏈路壓測,解決了業務監測和問題排查層面的諸多難題。

這就是阿里雲天然的優勢,因為這些雲產品經過了歷年雙十一的檢測,所要面臨的問題場景和複雜度也是業界最難的,能經得住這些場景的考驗,才歷練了阿里雲產品的能力。

用一年多時間重新出發,考拉海購如今走出了一條創新路徑,成為國內首屈一指的會員電商平臺。來自考拉海購官方的數據顯示,截至 2020 年 6 月 30 日,考拉海購會員規模同比增長 23% 。會員凸顯出高客單、高活躍、高復購的特點:會員年客單價是非會員的 7.3 倍,月度活躍是非會員的 2.4 倍,年訂單數是非會員的 4 倍。

Leave a Reply

Your email address will not be published. Required fields are marked *