作者| 阿里文娛高級無線開發專家 付笑冰
在線視頻平臺為用戶提供服務時,面臨的一個嚴重的挑戰是,如何保證在為用戶提供流暢且穩定播放服務的前提下,儘量降低整體運營成本。
本篇文章將圍繞上述問題,重點討論技術實踐中的成本控制手段。
一、視頻平臺成本的構成
視頻平臺在提供播放服務的過程中涉及到非常多環節和技術棧,每個環節都會涉及極其復 雜的計費方式,因此分析視頻平臺成本的構成是量化的第一步。在拆解成本構成之前,我們先以某視頻公司為例進行財報分析,其近期的財報如下所示:
從上述財報中可以明顯看出,相對於逐年增加的營業收入而言,運營成本及費用的增幅更為顯著,最終導致淨虧損額的逐年遞增。顯然,降低運營成本和費用的增速,就等同於降低淨 虧損、增大收益。
在對成本進行量化控制之前,首先對運營成本和費用的構成進行分析。某視頻公司 2019 年 財報關於成本的明細記錄如下圖所示:
可以明顯看出,除內容成本之外,帶寬成本是佔比最高的部分。此外,雖然其餘部分技術 相關的成本佔比較低,但就其總量而言也不能忽視。
就技術相關的開銷而言,視頻生產、存儲、分發等每個環節都需要不菲的成本支撐,而具 體花費金額則與公司的業務形態、採用的技術手段以及相應的定價明細息息相關。就播放業務 和視頻服務相關的技術棧而言,我們可將存在優化空間的幾個核心環節概括為:
1)生產:視頻轉碼和審核費用;
2)存儲:對象存儲 OSS 的存儲費用;
3)分發:OSS 流量費用,CDN 帶寬費用。
二、定價方式
除了上述視頻平臺成本相關的核心環節,定價方式是另一個重要指標。我們從阿里雲官網 計費模式處截取了不同環節的價格明細,其中轉碼定價如下圖所示:
根據圖中轉碼相關的計費方式,可得出如下結論:
1)轉碼費用主要受視頻時長、輸出分辨率、轉碼格式(H264/H265)等因素的影響。由於轉碼消耗的是服務器的 CPU 資源,所以轉碼成本基本上與其消耗的算力成正比。
2)從上表可以簡單推斷出,H265 需要的算力是 H264 的 5 倍左右;而且分辨率長寬每 分別提高一倍,總體算力也需要翻倍。不管是購買雲服務還是自購服務器,這個邏輯都是通用的,區別只是定價的不同。
除了轉碼以外,計費方案中還包括審核價格。優酷的UGC 業務比較發達,而 UGC 內容 的審核是必不可少的過程,審核定價明細如下圖所示:
同樣地,將審核相關的優化思路概括如下:
1)審核成本與視頻長短直接相關,而與分辨率以及編碼格式都無關。
2)基於價格數據,審核相關的成本運算需要關心的因素和畫面清晰度無關,因此可以只針 對固定的清晰度進行審核。
3)相對而言,審核成本顯著低於 H265 轉碼的開銷,而和 H264 轉碼開銷相當。 在分析完成轉碼和審核的成本策略之後,再分析一下帶寬這個成本開銷巨頭的優化思路。
阿里雲給出的帶寬計費方式如下圖所示:
針對帶寬成本的計費方式,可以採用如下的應對策略:
1)優酷等視頻平臺的月 CDN 費用大於 10 萬,所以會被按照 95 峰值來計算收費。
2)假設每月每天的帶寬使用相對均衡,單位成本就會更低。
在詳細分析成本時,僅依賴 95 峰值計費方式侷限性比較強,如果結合流量計費方式(如 下圖)進行綜合分析,可信度會大大提高。
在按流量計費方式方面,通過阿里雲官網計費明細得知:同樣一個產品,按照不同的計費 規則實際上的開銷不會差距太大,因此上述分析在不同場景以及不同定價的條件下,誤差較為可控,具有一般性。
三、播放體驗為何會影響成本
優質的播放體驗需要一定程度的成本支撐,二者在大多數場景都存在相互制約的微妙關係。 大家都知道,用戶觀看視頻時消耗的網絡流量,在最理想的情況下有如下關係:
播放視頻需要的流量 = 下載視頻使用的流量 但由於網絡抖動以及延遲等因素,如果簡單粗暴地看到哪裡下到哪裡,必然在播放時持續抖動,進而導致卡頓,這是用戶絕對不能接受的。基於上述最理想的公式進行簡單改進,增加緩衝區如下:
播放視頻需要的流量 + 緩衝區大小 = 下載視頻使用的流量。 然而,上述公式存在一個隱藏的縮放係數,其取值為[1, ∞),進而更新公式如下:
min(播放視頻需要的流量 + 緩衝區最大值, 受網速影響該時間段能下載的最大流量)= 下載視頻使用的流量 由此可知,緩衝區最大值無論用什麼策略去配置優化,在任何時段內必然是一個大於 0、小於無限大(至少小於設備存儲空間上線)的值。所以上述公式在統計意義上的形式為:
播放視頻需要的流量 x 固定放大係數 = 下載視頻使用的流量
其中,固定放大係數與單視頻用戶平均觀看時長是強相關的,如果用戶持續觀看不退出就 調小一些,如果用戶頻繁切換視頻就調大一些。因此整體而言,用戶情況穩定的情況下,固定 放大係數越大,用戶發生卡頓的概率就越小,服務商的帶寬成本就越高。至於如何在不增加用 戶卡頓概率的情況下儘量降低放大係數,另外有“播放體驗優化”的話題會進行詳細分析,此處 就不展開分析了。
四、定價如何影響技術決策
我們都知道使用 H265 比 H264 大約會帶來 20% 到 30% 的碼率節約,這與具體的視頻以及轉碼參數有關。碼率節約有兩個好處:
1)對用戶來說,看片時需要的碼率越低,出現卡頓的可能性就越低;
2)對視頻平臺來說,平均碼率的節約就等於 CDN 流量成本的節約。 所以我們把所有視頻都轉成 H265 是不是就能帶來全平臺 20% 到 30% 的節約?非常可惜,並不是的。
任何一個視頻網站,具體視頻的播放頻次都是接近呈指數分佈的,換句話說,視頻熱度的 長尾分佈極其明顯。大部分用戶大部分時間集中看少數視頻,而大量的視頻一個月內僅僅被觀 看一次,甚至完全沒有人觀看。從上文阿里雲按流量的定價來看,1GB 流量最低 0.15 元,1080P 及以下視頻 H264 格式每分鐘 0.0651 元、H265 格式每分鐘 0.3255 元。
舉例說明 H264/H265 的成本權衡方案,假設一個視頻時長為 60 分鐘、原始碼率為 2Mbps、 H265 轉碼效率為 20%,其在不同轉碼格式下的成本明細如下圖所示:
需要補充的是,由於當前大量設備不支持 H265,因此 H264 轉碼成本是無法避免的,此 處不做單獨說明。基於上述計算,H265 存儲收益和轉碼成本的收支平衡點為 19.53 / (0.135 -0.108) = 723 次。也就是說,在當前的定價下,一個視頻需要用 H265 完整播放 723 次,其CDN 成本降低的收益才能超過其轉碼的額外開銷,從而獲得成本節省。而實際上由於用戶並不會每 次都完整播放,上述數字還是要打折扣的,基於上述案例,綜合考慮後需要 1000 次甚至更多。
類似優酷等視頻平臺,其視頻類型主要包括兩部分:
1)官方採買和自制的電視劇、電影和綜藝等版權視頻:版權視頻受製作成本以及生態限制, 數量是有限的;而用戶觀看熱度較高的視頻,平臺也會傾斜優質的宣發資源,這部分視頻播放 量大,版權費用也較高,相對而言,一部視頻幾十元的轉碼成本就可以忽略不計了。
2)用戶自行錄製上傳的 UGC 視頻:海量的用戶上傳視頻較為長尾、曝光度較為分散, 如果對於總播放次數較低的冷門視頻還要進行 H265 轉碼,就得不償失了。
對於播放次數少的視頻,不但在轉碼上沒有必要生產成 H265,而且在存儲分發策略上也 應有所區分。具體而言,由於播放次數太少,每次播放都大概率因無法命中 CDN 緩存而需要 回源,在這種情況下,平臺要付出的成本就是 CDN 流量費外加回源流量費。如此一來,不但 額外花了 CDN 的錢,而且沒有帶來任何好處,還不如從 OSS 直接下載來得經濟實惠。
五、成本最優化展望
綜上,不僅視頻業務是不斷變化的,而且視頻播放生產等每個環節的成本也是不斷變化的, 因此成本優化的策略也會隨之變化。為了在滿足業務需求的情況下達到整體的成本最優,我們 必然需要徹底瞭解所有的環節,打通上層業務和底層技術的信息通道,權衡性價比,以持續獲 取最好的收益。
拋磚引玉以一個思路作為結尾,當前視頻平臺內的展示位基本上靠推薦算法和運營配置等 業務手段呈現給用戶,那麼一個視頻可以有多少播放量,以及是否有必要採用 H265 甚至 AV1 等碼率更低但是轉碼費用更高的格式,是完全可以建設一套系統進行精準預測的。另一方面, 在同樣轉碼格式的情況下,微調算法參數也會對成本計算產生較大的影響。所有的一切,都需 要我們針對每一個視頻進行精準的成本規劃,不放過每一處可優化的細節,聚沙成塔,從而獲 得最大限度的成本收益。