摘要:本文由衣二三CTO程異丁為大家講解了如何基於MaxCompute構建智能化運營工具。
衣二三作為亞洲最大的共享時裝平臺,MaxCompute是如何幫助它解決數據提取速度慢、數據口徑差異等問題呢?程異丁通過衣二三數據體系架構,從用戶運營應用、商品運營應用以及算法推薦系統三方面給大家剖析了MaxCompute是如何助力衣二三構建智能化運營工具的。
以下是精彩視頻內容整理。
衣二三是誰?
衣二三是亞洲最大的共享時裝平臺。衣二三提供女性服飾包月租賃制服務,會員們在APP上挑選喜愛的衣服,可以在平臺上用固定的月費在一整月內不斷地換穿衣服,衣二三通過快遞將衣服送到客戶手中,客戶只要會員期有效,就可以一直穿這件衣服,當會員不想穿的時候,衣二三還會通過快遞按照約定的時間地點將衣服收回,這樣會員就可以繼續下新的訂單,可以不斷地換穿各種衣服。我們的客戶從沒有畢業的學生到工作多年的白領,多種類型的客戶都能從APP上找到合適自己的衣服。
如今,電子商務發展非常成熟,線下逛街也是大家喜歡的生活方式,那為什麼在這種情況下還要租衣服呢?衣二三為客戶解決了以下幾個痛點:
1.打開衣櫥總是找不到今天想穿的衣服。使用衣二三,用戶可以靈活的換裝,不斷地嘗試不同風格;
2.費用高。衣二三標準的月費只有499元,相當於買一件衣服的價格,用戶可以用買一件衣服的價格換穿一整月的不同服裝。
3.大城市的房屋空間有限,擁有一個衣櫥對於很多用戶來說更是奢望。衣二三可以回收衣服,幫助用戶節約空間,同時還負責清洗衣服,正如宣傳語所說的那樣——“你負責貌美如花,我負責清洗收發”;
4.衛生問題。衣二三聯合福奈特、天天洗衣等共同打造了智能化現代化的洗衣工廠,每一件衣服需要經過多達16道清洗消毒流程,比自己家裡洗衣服還要乾淨;
5.購買和退換問題。衣二三通過體驗式的方式幫助用戶從款式、尺碼等方面找到真正適合自己的衣服,並且允許用戶買下來。
為什麼使用 MaxCompute?
衣二三的前後端運營比較複雜,前端需要讓客戶在儘可能短的時間認識我們,瞭解我們,才能形成轉化;後端也是特別複雜,與一般的電商相比,衣二三有明顯的異同,常規電商的客戶在前端下好單後,會通過訂單管理系統,將訂單派發到倉儲中心,倉儲中心會對訂單進行揀貨、配貨、包裝、物流等,最終將商品送到客戶手中,也可能伴隨著一小部分的退貨或返修,對於一般電商來講,整個流程到這裡就基本結束了,但是對於衣二三來說,該流程只進行了一半,我們需要對所有的衣服進行回收、清洗和質檢,才能夠再次上架讓客戶挑選,如此複雜的運營自然離不開大數據的支持,MaxCompute作為整個數據體系的核心,幫助了衣二三很多。
那麼,在未使用MaxCompute前我們遇到了哪些問題呢?主要包括以下幾方面:
數據提取速度慢。隨著系統不斷地變複雜,SQL越跑越慢。
數據口徑差異。每個工程師將邏輯都寫在SQL裡,不同工程師得到的數據結果可能不一樣,這就是因為我們沒有集中化標準化的數據倉庫對每一個數據維度和業務的指標有相應明確的定義,造成所有的邏輯都在SQL中。
Python腳本實現基礎ETL。作業調度與依賴難於維護與迭代,運維也是比較令人頭疼的,修復時間長。
人工數據提取及報表製作。工程師忙於提供各個業務部門的數據支持。
這些問題促使我們想要做出改變,起初我們想做一套完整的hadoop全家桶進行替代,但評估後發現其運維代價和資源消耗對於我們的數據團隊和運維團隊來說,都是比較大的負擔,而且很難快速體現價值。後來,我們很幸運的遇到了MaxCompute,從試用開始,我們逐漸把數據倉庫和數據體系建構在MaxCompute上。
MaxCompute有哪些好處呢?主要從以下幾個維度來分析:
1.MaxCompute是基於雲端的大數據倉庫,無需複雜作業運維工作
2.數據吞吐量大,查詢性能好,支持UDF
3.可視化任務編輯界面,易於上手
4.使用成本低,適合初創公司
5.與阿里雲大數據產品生態融為一體,比如RDS,應用層的Quick BI,Blink以及日誌服務。
如何應用MaxCompute?
衣二三數據體系架構如圖所示,最底層是數據源,包括RDS生產數據庫和日誌服務等,通過日誌服務、DataHub等投遞到數據計算層;數據計算層以MaxCompute為核心,同時配合我們自己做的腳本和UDF進行數據存儲和計算,生成的結果反饋到前端數據應用層;數據應用層是數據分析展示工具,包括YConsole、QuickBI以及DataV等,我們使用DataV做展示業務全局的看板,讓我們快速瞭解全國各地誰在下單、倉儲中心的儲備情況等。
我們還有包括用戶畫像、商品畫像、爆款識別、衣二三指數和實時人效監控等。
用戶運營應用
用戶運營對於互聯網公司來講,都是極其重要的,它有兩個業務指標,一是轉化,一是留存。轉化是指儘快讓客戶瞭解我們的價值,同時形成付費和轉化;留存是指讓已經成為我們用戶的用戶在平臺上得到好的體驗,讓用戶喜歡這種生活方式並留下來。
我們結合了MySQL數據和用戶日誌放到MaxCompute中,經過PAI平臺,我們自己做了數據分析,包括使用數據挖掘算法和隨機森林等的數據維度分析,對我們整個用戶運營做了很多量化指標,我們通過郵件日報對運營指標監控,基於這些指標我們開發了自有用戶分群體系推進用戶精細化運營;基於阿里雲機器學習計算平臺PAI,我們建立了預測模型,預測用戶的轉化率等;引入流失預警計算體系後,運營根據用戶的流失指數進行精準挽留營銷,將會員流失降低了超過50%。
商品運營應用
衣二三的每一個商品都有結構化的數據,我們專業的買手會給商品打上20+維度的標籤。此外,我們會總結用戶行為,用戶與商品之間的互動都放在MaxCompute中做相關性分析,形成商品的一系列指標,比如爆款識別,通過爆款識別去預測滿足哪些屬性和維度的衣服會形成爆款,我們的買手會帶著數據工具一起進行採購,極大的提高了運營效率。
我們還結合商品各個表現維度,包括庫存深度、出租情況等計算出衣二三指數,它可以對商品進行排名。除了給合作伙伴應有的租賃收益外,我們還會提供數據工具,最大化業務模式的價值。
商品的靈魂就是標籤,只要將標籤做的足夠細,才能從結構化上去理解它,去做一些預測性的指標。我們通過商品不同的標籤及風格場景熱度指數進行備貨指導,通過最終商品空置率進行商品調撥及庫存關聯,通過衣二三指數反映商品熱度排行,根據用戶行為促進租售轉化,完成商品流動閉環。
算法推薦系統
如何讓用戶在很短的時間內找到適合一個月穿的衣服呢?這就需要推薦算法的支持。
衣二三的推薦算法也是基於MaxCompute,把用戶對商品的行為通過日誌收集到MaxCompute中,對用戶進行用戶畫像,對用戶畫像進行模型訓練,最終落地到商品列表展示給用戶。使用推薦系統給我們的業務帶來很大提升,選衣頁推薦的點擊率增加了70%,人均點擊數增加了50%;相關單品推薦的點擊率增加了150%,人均點擊率增加了110%。
總結下來,大數據的魅力大家已經認識到,MaxCompute這樣的產品對於初創公司來講將大數據門檻降的非常低,讓大數據能夠面向各種各樣的公司來貢獻力量和發揮價值。謝謝在場各位的傾聽,以上就是我的分享。