雲計算

阿里雲李松林:全球實時傳輸網絡GRTN在互動直播中技術實踐

2021年6月9日,亞太內容分發大會暨CDN峰會在北京舉行,阿里雲智能邊緣雲技術專家李松林受邀參加互動直播論壇,分享基於阿里雲邊緣雲節點打造的全球實時傳輸網絡GRTN的設計思路、技術原理、特質與應用實踐,以及面向直播應用客戶提供穩定可靠的業務體驗。

image.png

當前,主流的直播技術應用架構主要有兩種:直推和回源拉流 ,產生這兩種架構的原因也比較簡單:一是業務場景需要連麥,需要低延遲雲合流;二是基於UDP的私有協議推流。為保障主播在弱網情況下能有較好的推流效果,而最重要的原因是目前主流雲廠商還沒有通用成熟的低延遲互動場景大規模應用的服務,這就導致了他們需要自建源站。只使用雲廠商通用的分發能力。支持 HTTPFLV 、RTMP 、HLS 大規模分發。

視頻直播服務自建面臨的挑戰
image.png

隨著直播場景和內容越來越豐富和專業,互動的需求也越來越多,交互的延遲要求也越來越高。原有的這套架構就很難滿足需求了。由於無法滿足自己的業務需求,許多企業客戶紛紛開始嘗試自建源站,做協議優化, 但是由於直播技術門檻相對較高,不僅需要投入資源,還需要專業的研發能力,同時後續還要長期持續運維和管理。

阿里雲GRTN的定位
image.png

為了能夠降低直播的端到端延時,阿里雲從直播、短延時直播、RTC等應用場景出發,構建了GRTN(Global Realtime Transport Network)全球實時傳輸網。李松林介紹,阿里雲GRTN的定位是基於公共雲中心Region和邊緣雲節點,構建超低延時、全分佈式下沉的通信級流媒體傳輸網絡。GRTN目前融合了互聯網直播和RTC等多種業務場景的音視頻流傳輸和交換。基於GRTN的短延時直播RTS可以支持標準H5 WebRTC推播,在千萬級併發情況下延時可以控制在1s以內;RTC端到端延時可以控制在250ms左右。GRTN可提供三大原子能力:流的發佈、訂閱、切換,用戶可以基於這些能力構建通話場景、直播場景、連麥場景等等。

阿里雲GRTN的架構
image.png

阿里雲GRTN 的整體架構是由原來的直播體系進化而來。該架構具有控制和數據分離、混合組網、多路徑傳輸、自學習Qos等技術特點,對外可以支持多種接入協議(rtc /rtmp / hls/ httpflv/ srt/ quic)。GRTN帶來的核心價值有:
降成本,GRTN是一個多業務融合的網絡,可以支持直播、RTC和視頻上雲等多種場景,業務複用率高,另外GRTN內部鏈路更短,節點內的成本也更低。

提質量,GRTN內部組網支持採用動態選路的方式來構建的網狀結構,內部鏈路延時可以做到20ms左右,並且內部鏈路採用了私有協議來進行高效傳輸。另外客戶端的推流和分發都是基於WebRTC來構建的,QoS擁塞控制是專門針對流媒體特性來進行設計的,並且還在基於線上數據建設進行持續迭代和打磨。

易擴展,GRTN支持了WebRTC協議,可以在單個連接通道上進行全雙工的通信,從而可以很自由的進行發佈和訂閱媒體流,在業務的擴展性上帶來了更大的想象空間。

GRTN關鍵技術-分佈式異構部署
image.png

在談到GRTN部署時,李松林指出,GRTN 的數據面可以在不同的資源上部署,實現一份代碼,多種資源部署, 滿足了低延遲全球覆蓋的需求。不僅擁有了CDN原有的節點覆蓋資源 ,而且還支持中心Region和 MEC 等資源,讓業務體驗更優。

GRTN 的關鍵技術-對等組網和動態路徑規劃
image.png

針對豐富的資源實現高效利用是核心。傳統的路徑規劃主要關注質量 ,對節點的屬性和水位等情況考慮較少,同時由於流媒體的複用性,當一個流已經出現在某一個節點的時候,整個路徑選擇就面臨新的調整。目前的策略是通過探測選路尋找優質的節點和路徑集合。建立節點路徑狀態表。對每條路徑的不同維度進行量化打分。綜合權重和策略得到一個新的最優解。
GRTN採用了混合組網方式,即層級結構和對等圖形方式相結合的組網的方式。選路中心會週期性收集內部鏈路探測的結果,為了配合動態組網,流媒體大腦模塊需要對流信息進行管理,同時還需要支持路徑切換、容量規劃以及在成本和質量之間做綜合的調度。

GRTN的關鍵技術-雙向實時消息網
image.png

有了控制面的路徑規劃和策略控制,如何快速準確的下發到數據面的每一個節點,每一個機器也是挑戰。在RTC場景下有一個比較常用的功能是客戶端網絡的Mobility,比如用戶在開會的過程中回家或是離開家的時候手機網絡需要在4G和wifi之間切換,另外考慮客戶端接入的CDN節點出現異常的時候,這兩種情況都會造成客戶端在和GRTN通信過程中切換接入節點,GRTN構建的雙向的實時信令網能夠做到切網消息的毫秒級傳遞,當有一個發佈端的媒體流發生網絡切換後,訂閱的客戶端對GRTN內部發生的切換行為是完全無感知的。

GRTN的關鍵技術-流媒體孿生
image.png

李松林介紹:GRTN借鑑數字孿生的思想設計了一個流媒體孿生(Streamimg Media Digital Twin)系統,用於容量評估、算法訓練、事件覆盤和模擬壓測等。通過將系統分成現實和虛擬兩個環境。現實環境複雜收集真實的場景和數據,虛擬環境負責做容量評估和算法訓練。當修改了新的策略之後可以通過現實的歷史數據輸入到虛擬環境中應用新的算法。通過數據處理,生成數據報表對比之前這些數據在真實環境中的情況。這樣就可以指導新的算法調優,也可以評估新算法是否有效。

GRTN的關鍵技術-可編程
image.png

媒體技術的上層業務場景非常豐富,比如電商直播、視頻會議、在線教育、企業直播、新零售等,因此有很多定製化開發的需求。可編程化改造是GRTN在提升系統穩定性上的一次嘗試,目前GRTN的中心流媒體大腦,節點側的業務模塊,媒體數據發送模塊、媒體信令處理模塊等都已經進行了可編程化改造,大部分情況下都可以避免二進制的發佈。

GRTN的關鍵技術-全鏈路可視化監測
image.png

李松林認為,可觀測性是評估一個系統是否可以對外服務的基礎。當線上出現問題可以及時快速的定位和處理,避免影響擴大。同時也可以通過觀測系統收集數據,不斷優化系統。

基於GRTN打造超低延時直播RTS
image.png

為了更加方便客戶和行業擁抱GRTN,阿里雲基於GRTN打造了超低延時直播服務RTS,其有四個技術特性:
秒級延時和卓越的抗弱網能力,在相同卡頓率下延時可以降低80%,相比於傳統的RTMP和FLV的5-10s延時,RTS的延時可以達到1s以內,並且還在基於線上的大數據,在自我學習和持續迭代中。

成熟穩定,RTS歷經2年多時間的潛心研發,並經歷了淘寶直播618大促的線上考驗,目前已經在淘寶直播上線。

開放標準,為了能夠方便自研播放器的客戶使用我們的RTS服務,阿里雲的WebRTC接入的信令協議的完全開放的、透明的。

廣覆蓋和高併發,RTS服務是構建在阿里雲2800+邊緣節點之上,可以支持千萬級併發播放。

李松林還分享了具體案例:淘寶直播在2020年雙11首次大規模使用全球實時傳輸網絡GRTN的技術,交互體驗得到了極大的改善,成交轉化率得到提高,直播帶貨GMV提升了5%。
面向未來,越來越多的直播應用到人們的生活中,阿里雲將持續加碼直播領域技術創新,打通直播的最後一公里,依託遍佈全球2800+邊緣雲節點,提供穩定、可靠、安全的直播服務,面向用戶打造更接近真實場景的直播體驗。

Leave a Reply

Your email address will not be published. Required fields are marked *