雲計算

擴容、重保、盯盤……在家“隔離”這1個月,阿里雲視頻雲這些工程師都經歷了什麼?

戰"疫”當前,沒有誰會置身事外。從1月底開始,一場全民疫情阻擊戰拉開帷幕,企業停工、學校停課、商場停業,城市街道分外冷清,相反的是,無法出門的數億網民卻在互聯網上掀起了一陣不小的流量熱潮。距離2月10號的那次流量洪峰,已經過去整一個月了。此時的喻義正在組織內部視頻會議,對這一個月以來的工作進行復盤。在他看來:危難面前,更能檢驗技術力量,這是一場前所未有的硬仗,也是一個身為技術人特有的高光時刻。在這場戰“疫”中,有一些故事值得被記錄。

疫情之下 時刻在線

春節假期期間,喻義所在的阿里雲視頻雲團隊剛剛完成了春晚直播的護航,如果是往年,到了大年初二,他們就可以放下緊張的情緒,將注意力迴歸到家庭了。但今年不同,受到疫情影響,1.8億家庭蜂擁網上看賀歲片,4000萬網友在線雲監工火神山,2億人集體在家復工,全國中小學生空中開課……海量視頻數據洶湧而來,在互聯網之上奔流湧動。

喻義從春晚護航開始就一直緊盯CDN資源大盤,眼看著數據節節攀升,作為CDN產品架構和邊緣基礎設施團隊的負責人,他接到任務,將為這次互聯網流量遭遇戰掛帥出征。

對於任何互聯網服務來說,用戶的穩定、流暢、高效地使用都是體驗的基礎。而CDN的任務就是要確保這條“互聯網信息高速公路”的順暢通行,避免因為擁塞而導致出行效率的降低。

“說實話當時雖然業務有點緊迫,但是我們還沒有對接下來的流量大爆發有充分的預感,所以前期基本是在複用之前的技術方案,加之每年雙11期間和一場場大活動的經驗積累,我們還是很快就把方案跑通了。”喻義說。

喻義工作照.JPG
(在家辦公,喻義佔用了女兒的小書桌)

然而在2月1日的時候,工程師們就覺得不對了,來勢洶洶的新冠病毒給他們打了一個措手不及。大批線下流量轉移到線上,用戶和在線時長的爆發式增長,也帶來了帶寬需求的井噴。提出擴容需求的客戶越來越多,系統預估在接下來幾周的推流和帶寬業務量將大大超出之前預期的數據。

整個釘釘群裡充斥著這樣的話語:“客戶要加量,下週一要翻10倍,快做方案!”、“這波峰值平穩過了,預測下一波在2小時後”、“客戶端質量數據拉出來了,半小時後拉會拍優化方案”、“這個流的視頻碼率要穩定控制在850Kbps,誰來配合我搞一下?”、“這延遲肯定不行,調不好不能給客戶上線”、“節點水位已經接近安全閾值了”……喻義的心也跟著懸了起來。

被捲入這場戰役的每個人都不容易。時間緊任務重,這群工程師要在短短几天時間內要完成資源儲備和調度,調整直播技術方案,做足應急預案,同步還要確保對線上客戶的問題響應和護航,跟他們一起扛住一波又一波的流量高峰。

千錘百煉 “疫”不容辭

為什麼要擴容?當遭遇網絡流量驟增、用戶請求量增長時,平臺面臨著下行流量帶寬水漲船高,服務器壓力變大的問題,站點響應慢、連麥效果變差、音畫不同步、互動不及時等一系列連鎖反應都會出現,在線教育、視頻會議、互動直播等視頻類業務首當其衝。為了確保用戶體驗不受影響,不讓帶寬成為業務增長的阻力,提前“備糧”是不二之選。

比如兄弟團隊釘釘,他們在阿里雲上緊急擴容1萬臺雲服務器,保障業務的連續穩定。同時也向阿里雲CDN提出了擴容需求,確保釘釘視頻會議、群直播的用戶流暢體驗。

釘釘在家辦公.png
(圖片摘自網絡:這個開工季,釘釘視頻會議是常態)

所有人都知道流量一定會增長,但是到底會漲多少,在什麼時間點迎來爆發,誰也不敢下保證。這麼頻繁的擴容和龐大的體量也給了CDN系統帶來了不小的挑戰:

第一,特殊時期依舊要確保交付效率

疫情來的太過突然,流量的迅猛增長給系統帶來的衝擊不亞於每年雙11,然而留給所有人準備的時間往往只有幾天,保持帶寬資源的充足、彈性,在較短時間內為眾多客戶應急擴容是一個很大的挑戰,加之疫情期間封路、封城、施工人員隔離等各種不可控因素,擴容之路異常艱辛;

第二,平臺流量越多,對調度系統的考驗越大

當CDN平臺上有越來越多的流量湧入,如何更高效地進行資源規劃,實現全網負載均衡?如何實現精準的流量預測與控制?如何賦予業務必要的彈性?如何智能分析流量畫像,準確判斷和預估出每一路直播的CPU和帶寬消耗,精細粒度的調度資源這些都是難點;

第三,極限場景下的業務穩定性保障

疫情期間存在各種客觀因素制約,直播鏈路涉及到推流、轉碼、錄製、截圖、時移、分發等等環節非常長,怎樣預先避免資源瓶頸這類極限場景?如果出現了,有哪些應急手段可解?怎樣把對客戶的影響降到最小?

第四,重保每一個客戶

疫情期間每一個在線教育和遠程辦公平臺背後都承載著一份希望,工程師們遠離客戶現場,很多都是隔離在家,卻依舊要保持對臨時需求變更的迅速響應和高質量交付。

“挑戰再大,也不能把為客戶服務的腳步給嚇停了。從2014年阿里雲CDN上線到現在,這種挑戰無時無刻不存在,所以我們的武器(技術)才能被磨的更光更亮,我們還是有信心能打贏這場遭遇戰的。”喻義說道。

首先,在資源部署上,阿里雲分佈CDN全球2800+邊緣節點和130Tbps帶寬儲備,已經具備足夠的彈性容量,團隊也成立疫情支持專項小組,其中專門負責資源管理和建設的同學7*18小時盯盤跟進資源擴容,確保彈性。其次,在調度系統上,阿里雲智能調度系統可以做到15%業務彈性自動化兼容,確保節點水位平穩跑在80%,基於全球LDNS進行畫像和基於分鐘級日誌精準分析,以此完成偏差在5%以內的流量精準預測,同時保證調度策略秒級生效。第三,經過了11年雙11和2018年俄羅斯世界盃的打磨之後,CDN對視頻高併發這類業務場景已經比較熟悉,具備一套成熟的解決方案和完整的應急預案。在服務30多萬客戶的過程中,針對點播、直播、HTTPS、大文件、客戶端、內容安全防護等不同業務類型,系統的技術儲備也比較充足,可以為客戶提供場景化、針對性的加速方案,使得收益最大化。

每次的商業變革都將催化新技術的創新和應用,這次極限拉練也給了阿里雲視頻雲不少新技術大展身手的機會,幫助在線教育行業解決了低延時、高併發、大帶寬等行業通用難題。其中,超低延時直播RTS(Real-time Streaming)服務在疫情期間支持了大量在線教育平臺,在直播推流端、播放端通過SDK嵌入的方式集成阿里雲私有協議,實現直播延遲降級到百毫秒級;多中心百萬級併發推流解決方案,提供專門應對海量推流場景的全鏈路優化,可助平臺更從容應對短時間的併發開課;自適應碼率解決方案採用機器學習手段,通過分析歷史編碼信息和待編碼幀的複雜度,在不影響人眼主觀觀看質量的情況下,減少低複雜度場景的碼率消耗,確保每一幀都能以最合適的碼率編碼,從而針對在線教育場景降低50%以上碼率,大幅節省帶寬成本。

“過去幾年的護航經驗和專業的技術儲備讓團隊底氣很足,接下來的幾波流量高峰也平穩度過了。看著客戶的直播穩了,CDN大盤穩了,我們才能安穩得睡一覺。”喻義說道。

使命必達 上路即狂奔

過去的1個多月裡,合作多年的在線教育平臺不斷加碼、各地教育部門發起的空中課堂頻繁上線、和兄弟團隊的合作緊鑼密鼓,阿里雲視頻雲不曾停歇。

1月31日起,在線教育群雄四起,CDN和邊緣節點服務開始為各大平臺擴容重保,為猿輔導、好未來、VIPKID等數十家平臺提供技術支持。

2月3日,特殊開工日,CDN護航了釘釘上1000萬家企業的在線開工,為視頻會議、群直播的順暢訪問提供有力保障。

2月3日,阿里雲視頻雲與保利威聯手搭建“空中課堂”,幫助黃岡中學高三班重回課堂,確保在整個線上直播系統在增長數倍的情況下,依舊能保持高清的畫質和流暢的交互體驗。

2月6日,阿里雲視頻雲發佈停課不停學在線教育專項扶持計劃,用免費產品套件和千萬補貼基金全方位馳援教育機構和SaaS合作伙伴,通過視頻點播、視頻直播、RTC等產品技術賦能教育客戶更快速、更經濟地搭建多端遠程授課應用。

2月10日,阿里雲同天喻教育、微吼科技共同建設的武漢教育雲“空中課堂”上線。也是在這一天,全國60萬教師在釘釘直播上課,CDN保障全國5000萬學生“在家上課”低延遲、流量的體驗。

13e8-iprtayz1894383.png
(國家中小學網絡雲平臺上線)

2月17日,國家中小學網絡雲平臺正式開通。在此之前的7天內,阿里雲完成了全部CDN資源部署,確保平臺網絡帶寬充足和視頻傳輸鏈路的穩定。

2月19日,寧波教育局“甬上雲校”累計瀏覽量突破2500萬次,總流量達到1200T,相當於300萬節課已經被瀏覽,阿里雲視頻云為其提供了多直播中心部署和就近的優質節點接入,為百萬學生的上課體驗保駕護航。

截至目前,停課不停學在線教育專項扶持計劃發佈1個月有餘,已經累計為數千名中小企業提供專項技術扶持和免費產品服務。不止如此,阿里雲視頻雲也為全民“雲拜年、雲聚餐、雲蹦迪”築起了一道堅實、極速的流量長城,此時此刻,故事還在繼續。

屏幕快照 2020-02-06 上午9.17.52.png
(在線教育專項扶持活動部分免費產品)

暖春花開 未來已來

疫情給國民生命和經濟帶來了打擊,也給大家日常工作和生活都帶來了很多不便。但是客觀環境的改變,卻讓在線教育、線上辦公、互動直播等“在線”業務迎來了意外的發展機遇。未來,零售、金融、政務、醫療……越來越多的行業會將目光瞄準“在線”, 在線化、數字化轉型將會使得作為IT基礎設施的雲計算技術提出更高的要求,而CDN則是在線業務堅守“流暢、穩定、可靠”的最佳防線。

為了做好數字經濟的流量底座,阿里雲視頻雲不僅在資源和產品服務上加大投入,也聚焦在智能中臺、邊緣安全等領域做了不少技術投入:“我們已經建成了從智能運維,實時數據監控、全網動態實施故障感知到智能自修復的全鏈路智能運營支撐平臺,用於提升系統穩定性,確保業務724365可靠。而針對政府網站、金融、企業辦公這類對安全有特殊需求的業務場景,我們也在CDN上納入了邊緣防護能力,支持邊緣WAF、DDoS防護,防CC,防Web應用攻擊、HTTPS傳輸加密,同時面向客戶提供防爬、防篡改、防盜鏈、防劫持等防護手段。CDN也已經通過了等保2.0三級認證,希望能為客戶帶來安全與加速的一站式體驗。”喻義介紹到。

5G 時代,更多在線、視頻類創新應用將會被激活,CDN將從內容分發將演變為價值傳遞,作為承載流量的基礎技術與邊緣計算相結合,成為各行各業提升效率、優化經營、智能應用的強大驅動力。

不知不覺,窗外已經是暖春,城市正在復甦,喻義心想:“或許CDN的下一個春天也已經在路上。”

上雲採購季 CDN&視頻雲優惠

點擊直達上雲採購季,獲取CDN和視頻雲產品優惠
採購季2.png

Leave a Reply

Your email address will not be published. Required fields are marked *