開發與維運

數據湖行業解決方案解讀—互聯網娛樂行業最佳實踐

隨著互聯網的普及以及技術的發展,互聯網娛樂行業的發展也日漸成熟。從早期單一門戶網站,到個人博客的流行,再到視頻網站的壯大。以及這兩年層出不窮的短視頻、直播、資訊平臺等,網絡娛樂行業的發展也正在從內容為王,開始往大數據驅動內容創新與推廣的方向進行發展。

全民娛樂時代,網絡互娛市場持續保持高速增長
隨著生活條件的變好,人們進入了娛樂即生活,生活即娛樂的時代。如同互聯網時代到來引爆信息爆炸一樣,互聯網娛樂的興起和發展同樣有爆發力。據統計,截至2019年6月,我國網絡直播用戶規模達4.33億,較2018年底增長3646萬。而網絡視頻的用戶更是達到7.59億,較2018年底增長3391萬。
尤其是在15年前後,隨著4G的普及以及智能機的大眾化,互聯網娛樂行業迎來了一次流量紅利時期,在這個時期,各種資訊、視頻、直播、社交等軟件如雨後春筍般冒出,大量的用戶開始湧入。在當時只要是有稍微優質的內容輸出,就能為作者或是整個平臺帶來巨大的流量。

流量紅利消失,用戶增長陷入瓶頸
但是到了2020年,流量紅利的時代已經過去許久,雖然內容還是主要的內核,但是內容同質化嚴重,用戶逐漸進入疲勞期。同時由於整體市場格局的明朗化,各家企業之間的競爭與壓力也逐漸變大。
流量紅利的消失,企業增長放緩,企業整體拉新成本變高,留存客戶難度變大。同時由於國家對於內容審核的條件逐漸收緊與明細化,單靠人工已經無法應對大規模的內容審核,只能通過機器,依賴技術來達到監管合規的要求,但如此操作勢必會增加企業的運營成本,造成更大資源的投入。

大數據驅動行業發展,但如何利用好數據成難題
相信大家都會有過這種體驗,在我們瀏覽某些短視頻網站時,若是隨手點贊或評論了某幾個相同類型的視頻後,之後你刷到該類型視頻的次數會大大增加。其實這就是企業通過大數據來推測並匹配我們的興趣愛好,針對每個不同個體的用戶,為其定製個性化的內容推薦。
在大數據的驅動下,企業可以精確地對相關用戶進行篩選,為其定製個性化的內容推薦,但是在大數據系統構建的時候,很多企業又遇到各種各樣的技術挑戰。
由於數據源採集的方式和存儲方式的不同,往往會形成數據孤島的現象,同一用戶的數據可能會有好幾種表現和存儲的方式,如果企業要將這部分的數據進行分析,就需要將數據進行轉換並在多個數據孤島之間反覆拷貝。
同時由於互聯網具備高時效性與高度開放性,可能會出現大量用戶在某個時間段內同時湧入某個軟件,尤其是一些社會性的熱點出現時,對於企業的服務器將會是一個巨大的考驗。按照傳統的處理方法,企業往往需要預留大量的空間來應對不同時期的流量,但是該種模式還是太過於缺乏靈活性,大多數服務器空間在非熱點時期只能白白閒置,極易引起IT資源的浪費增加企業運營成本。

阿里雲數據湖解決方案打破數據孤島,全面提升資源利用率
數據湖是以集中、統一方式存儲各種類型數據,數據湖可以與多種計算引擎直接對接,我們使用OSS作為數據湖底座,數據統一存儲在OSS中,有效消除了數據孤島現象,多種計算與處理分析引擎能夠直接對存儲在數據湖中的數據進行處理與分析,避免數據在不同引擎中反覆複製,減少了不必要的資源損耗。
數據湖的存儲基座OSS提供了高可用性和可靠性保障,端到端的解決了海量數據的存儲、管理問題。直接對接多種數據輸入源,數據可以按照最原始形態直接寫入到OSS,無須在終端做任何處理,減輕終端設備負載。OSS提供的互聯網直接訪問特性,極大簡化數據傳輸的通路,無須經過各種代理,就可以實現數據的直接存取。
數據湖採用存儲與計算解耦合架構,讓計算、存儲資源具備更好的擴展性,極大降低運維管理難度、提升資源利用率。
無論是點播、直播錄製、日誌分析、資訊分發等典型的互娛場景,採用數據湖方案,相關數據都可以按照統一方式存儲在OSS,並通過阿里雲的計算引擎,比如EMR 、DLA、Max Compute等產品與對象存儲OSS結合,直接對存儲的數據進行處理,處理後的結果數據有可以持久化存儲到數據湖中。
阿里雲數據湖解決方案,幫助企業釋放最大的數據價值,讓大數據的沉澱、存儲、處理、分析更加簡便快捷,幫助企業快速完成現有業務的迭代升級與重構,讓企業在行業佔有一席之地。

Leave a Reply

Your email address will not be published. Required fields are marked *