一、服務發佈簡介
分佈式系統架構下,服務發佈是一件很麻煩的事情,特別是在構建自動發佈流程和灰度測試的策略兩個核心方面。通常情況下如果不涉及數據層面的灰度流程,服務可以灰度上線,或者滾動上線,這兩種方式很常用;如果涉及到數據灰度,則可能需要中間服務做不同版本數據之間追平,或者停機維護一次性處理好數據和上線問題,不過後面這種方式風險較大。
二、藍綠部署
新版本上線的時候,並不停掉老版本,新舊兩個版本同時運行,通常還會在負載均衡的策略上傾向於舊版本服務處理請求,這樣新版本就有一個執行的觀察期過渡期,等到新版本平穩運行一段時間後,再把請求都發到新版服務上,舊版本服務完成下線。這種方式在分佈式架構下很少使用,對服務器要求過高。
三、滾動發佈
滾動發佈可以避免藍綠部署的服務器資源佔用問,首先發布一臺新版本服務,然後停掉一臺老版本服務,新版服務經過觀察之後,再逐步替換掉所有老版本的服務,這樣服務的環境變動比較頻繁,相對不穩定。
四、灰度發佈
上述兩種方式在普通業務場景下都還算好操作,分佈式系統下的灰度發佈複雜程序相對高很多,基礎流程如下:
新版本上線,可能涉及分佈式下多個灰度服務,因此在服務在整個鏈路上分發時,都要判斷下個請求是路由到正常服務還是灰度服務,還要對灰度服務做請求的權重控制,不能讓灰度服務處理大量的請求。
實際策略:在實際的分佈式系統灰度發佈流程,通常會採用如下一個策略:
- 配置一個灰度是否開啟的標識;
- 配置一批灰度賬戶,通常內部人員;
- 配置灰度服務版本標識;
- 請求在鏈路執行時,判斷灰度是否開啟;
- 判斷當前用戶身份是否是灰度測試賬號;
- 獲取當前可以請求的服務列表;
- 根據灰度服務版本選擇請求的具體服務;
這個流程非常的複雜,需要很多自定義的策略,還要熟悉分佈式框架的底層API原理,要二次重寫來適配灰度策略,設計重寫原生API還容易觸發一些驚喜問題。
五、數據庫灰度
如果說最難處理的灰度模式是什麼,就是數據庫的版本灰度問題,通常業務對數據庫改造升級,實際都是通過停機維護來處理的,可能很多開發都經歷過,發佈停服公告,然後在指定時間內把數據全部追平或者二次搬運,再重新提供服務。但是總有些業務場景是不能停機維護的,處理灰度數據的基本策略如下:
該模式中,除了正常的灰度流程之外,需要在灰度數據庫和正常數據中間提供一個數據調配服務,用來解決如下問題:灰度數據庫缺失數據,需要臨時從正常庫拉取,灰度版本失敗,新數據需要重新整合寫入原本正常庫;灰度版本成功,舊版數據遷移等;最終保證數據的平穩升級。