大數據

【智能推薦系列公開課講義④】7天搭建電商個性化推薦場景和最佳實踐

內容要點

本文主要以電商行業為例,從服務搭建流程、推薦測試流程、最佳實踐分享適配的智能推薦快速搭建方式和實踐策略。

服務搭建流程


1.jpg
智能推薦作為一款大數據應用產品,數據是第一生產力,如果在沒有任何數據的情況下,想做千人千面的推薦,是不太可能的。數據對於整個模型而言,都是非常重要的。智能推薦所需要的數據,分為三類,user,即推薦面向的終端用戶的信息;item,即要推薦的內容,例如在電商行業就是商品;behavior,即行為,指發生在user和item之間的交互動作,在平臺上,消費者的消費偏好,商品的用戶喜好畫像,都可通過behavior來表徵。

對於智能推薦的模型來說,一方面依賴海量的行為,進行模型計算,另一方面也會根據商品、用戶的靜態屬性做分析推薦。無論是上報的全量數據表,還是後期的行為數據、用戶數據、商品數據,經過全量和增量數據的合併,代表了AIRec底層的數據倉庫,最終會提供推薦經過精排之後的結果集。從數據層到智能推薦的結果集,中間經歷了模型的訓練。

2.jpg
在開通智能推薦之前,需要做數據準備,包括user、item、behavior,之後進行實例的開通和配置。因為不同的行業具備不同的屬性,優化的目標和所需的數據類型都有差別,所以智能推薦會按照行業模板來區分。

第二步,需要選擇推薦服務類型,表示智能推薦的結果,有猜你喜歡、相關推薦,不同的類型應用的場景是不同的,需根據業務場景進行選擇。

配置數據源,現有3種配置方式。之後進行模擬測試,後期也需要把實時變化的數據同步到智能推薦。通過SDK獲取推薦結果。

數據準備階段,所面向的user都是平臺上的消費者,item就是商品,behavior就是用戶和商品之間發生的關聯動作。用戶需要按照產品官網上的數據規範,結合每個字段的信息進行上報。

用戶表

3.jpg
用戶表是實現千人千面的前提,因為希望實現給每個消費者都提供不同的商品集,需確保訪問的每一位用戶都有自己唯一的身份標識,可通過user_id或者手機設備號確定。如用戶是遊客狀態,則需通過其他方式確定用戶身份,否則將只能獲得熱品的推薦。另外還需要提供用戶特徵的字段,包括性別、年齡及其他標籤,將有利於基於畫像特徵分析的推薦。

物品表

4.jpg
代表商品的信息表。每一件商品也需要具備唯一性。智能推薦通過item_id和item_type來標記指定唯一的商品。Status表示了當前商品狀態是否可被推薦,0表示不可推薦,1表示可推薦,可實施遇到商品上下架時的干預。Title表示對商品的標題描述,智能推薦會結合商品的描述進行語義分析。Scene_id表示物品可被投放的子場景ID,通過這個字段進行區分和效果觀察,可根據推薦展現形態進行設計。Weight指item的權重值,當產品質量較好,或考慮到業務方、廣告主的要求,可進行加權,初次接入時,建議不要加權,加權可能會導致模型結果受到人為的干擾,對效果產生負影響。pub_time代表內容發佈時的時間戳(秒級),用於判斷內容是否為新品,expire_time表示內容失效時間戳,失效後,商品將不會再被推薦,兩者用於控制item時效性。category_level表示類目層級數,category_path表示類目路徑。Tags表示標籤,可加具體的類目含義,例如品牌信息、屬性、適用人群,會被用於模型的訓練,利於效果提升。

場景具體使用

比如淘寶首頁猜你喜歡,有全部,表示所有商品都可出現,便宜好貨則有價格門檻,只有低價產品會在這個tag頁出現,以上兩個就是完全不同的推薦場景。如果APP上有類似的形態,需要在商品選擇、部署上進行場景區分。另外,包括購物車的猜你喜歡和首頁的猜你喜歡也是不同的,投放端的不同,會帶來用戶心智、行為不同等,建議區分不同投放端進行效果觀察。

行為表

5.jpg
行為表徵了平臺上用戶的特徵信息、傾向。每一條行為也需要定位到唯一的用戶和商品。bhv_type表示行為類型,例如曝光、停留、點擊、收藏、下載、購買、加購、評價等。trace_id表示請求追蹤/埋點ID,用於在AB實驗時區分,效果對比。trace_info表示請求埋點信息。bhv_time表示行為發生的時間戳。bhv_value表示行為詳情,例如點擊次數,停留時長,購買件數、購買金額等。曝光數據是必不可少的,如曝光之後,有停留、點擊、收藏、下載等行為信息,可將曝光數據在模型中作為負例數據。

實例創建

6.jpg
智能推薦目前支持內容型、商品型、新聞型模板,如視頻類型需要在內容型進行創建。

數據對接方式

以下情況,可啟用第一種數據對接流程

  • 如行為數據沒有埋點或需要進行埋點更新,可用定製版SDK進行埋點。
  • 如數據本身就用了友盟SDK採集,需要結合數據規範稍作修改就可完成數據上報。

A 數據對接流程
通過友盟SDK採集到的行為數據,需要在控制檯進行配置即可自動同步,無需手動上報。
7.jpg

以下情況,可啟用第二種數據對接流程

  • 如數據存在MaxCompute,需按照標準配置進行實例創建,後續同步SDK即可。

B 數據對接流程
8.jpg

以下情況,可啟用第三種數據對接流程

  • 如數據沒有存在MaxCompute或需要快速啟動服務,可以使用服務端的SDK快速對接數據。

C 數據對接流程
9.jpg

結果獲取

10.jpg
需指定場景、唯一用戶、請求數量(一次最多請求50條結果),將返回唯一商品、位置信息、traceinfo,之後將進行行為數據的回傳,行為類型、發生時間、場景、traceinfo,將這些行為信息回傳給智能推薦後,就形成了流轉的過程,促進結果的實時更新。

推薦測試流程


11.jpg
用戶分為兩種,一是老用戶,存在行為;二是新用戶,不存在行為,需根據兩種不同的用戶分層進行測試。推薦測試包括結果測試、功能測試、效果基礎測試和效果進階測試。在測試之後,將會正式接入線上流量,進行結果的持續觀察和效果提升。

最佳實踐策略


首頁推薦可以結合長短期興趣、用戶畫像分析進行集中展示。
12.jpg

數據圈選

1、提前過濾違規、質量差的商品
2、按照場景訴求進行選品分類,類似便宜好貨,保證價格門檻
3、及時更新商品生命週期

特徵豐富

1、具備商品的標題信息
2、上傳商品的類目、品牌、風格、性別等信息
3、豐富曝光、點擊、購買行為上報

電商行業經常遇到的問題

為應對用戶疲勞,可進行打散和混排。
13.jpg
14.jpg

加入社群


點擊訂閱《阿里雲搜索與推薦技術交流期刊》

掃碼入群,瞭解更多資訊,獲取課程資料

5aa4fa1e3fa84556b22e9ae931cffd4d.jpg

Leave a Reply

Your email address will not be published. Required fields are marked *