開發與維運

玩吧高速增長的數據上雲實踐

作者:玩吧數據智能負責人 於海亮

玩吧簡介

首先向介紹一下我們的公司,公司全稱是北京默契破冰科技有限公司,創建於2015年,是一家娛樂社交平臺公司,玩吧是我們公司APP的名字,APP上有很多雙人小遊戲,像臥底大師,你說我猜,大家可以邊玩邊聊,輕鬆交友,讓社交更輕鬆。

玩吧數據上雲架構

1.png

下面介紹下玩吧數據上雲的架構圖,最左側數據採集是通過Kafka集群和DataWorks數據集成,中間的流批一體數據倉庫,離線數倉用的是阿里雲的MaxCompute,實時數據分析使用的是Hologres,機器學習用的是阿里雲的PAI,BI報表使用的是QuickBI系統,數據的開發、治理和運維使用的是DataWorks平臺。

玩吧BI系統

2.png
玩吧的BI系統使用了阿里雲的全棧產品進行搭建。數據採集使用了阿里雲的日誌服務,業務DB的數據通過MaxCompute的實時同步系統,將數據同步到數據倉庫,離線計算使用ODPS SQL,將數據進行運算處理。最後通過Hologres產品來進行交互式分析。Hologres可以和MaxCompute產品做無縫的集成,節省了數據計算後搬運的時間。數據的展現使用了阿里雲的QuickBI,可以靈活的配置數據報表。整體平臺的搭建,可以快速地完成。

玩吧數據模型系統

3.png

我們的統計分析日誌模型是基於事件模型的,事件模型主要包括了用戶和event兩個實體,簡單來說一個event描述了一個用戶在某個地方以某種方式完成了具體的事情。用戶記錄和收集長期屬性,形成user profile,通過ID與相關的event進行關聯。

玩吧數據計算

4.png
最後我們的數據計算分成了統計類的數據,規則類的數據,機器學習類型的數據。 從日誌服務加載靜態數據和動態event數據,到離線倉庫,通過 MaxCompute進行數據的離線計算,最後數據的標籤使用PAI系統進行計算,輸出的結果同步到Hologres。公司以前的數據輸出到HBASE,並建立了二級索引加速,現在使用Hologres可以完美的替換。

玩吧大數據應用場景

5.png

最後我們在數據應用上我們有了很多的探索,在這裡給大家舉一個例子,很多公司做運營活動時,都希望能促進用戶的付費破冰,提升用戶的付費金額,以及用戶的復購率。付費破冰可以通過首充活動來實現。首充活動對用戶的吸引程度主要取決於以下幾點:活動的觸達方式和時間是否與用戶轉化的時機契合,活動的形式是否符合用戶偏好,活動的獎勵是不是用戶所需要的。我們這裡對用戶的首充屬性進行分析,根據用戶付費後的行為活動,推測不同類型的用戶的付費時間點和付費動機。
瞭解首充用戶的付費動機後,進一步和活動特性進行關聯,將其使用在其他未付費用戶身上,首充時間代表著用戶的轉化週期,在一定程度上代表了用戶的轉化難度,對於轉化難度較高的用戶,可以適當的調高獎勵的成本。首衝金額代表了用戶的質量,用戶首次充值的金額可以推測用戶的付費潛力,首充之後的消耗,反映了用戶的付費動機,用戶對於什麼樣類型的產品跟服務感興趣,在對應的活動中,會結合以上的行為,對用戶進行付費轉化。
謝謝大家!

資料下載

點擊下載》》資料

Leave a Reply

Your email address will not be published. Required fields are marked *