獨家下載!《SIGIR 頂會論文解讀》電子書重磅發佈

>>點此查看第一期:《KDD論文精華解讀》<<

《SIGIR 頂會論文解讀》重磅發佈

由 7 位阿里巴巴技術專家精心打造,內容覆蓋推薦系統 、成交轉化模型 、 迴音室效應 、 全空間多任務轉化率預估建模 、 DeepMatch 召回模型 、 跨領域冷啟動用戶推薦網絡 、 表示學習模型等信息檢索領域新技術。

⬇點擊下載⬇

>>《SIGIR 頂會論文解讀》>>

或者複製該鏈接到瀏覽器完成下載或分享:https://developer.aliyun.com/topic/download?id=724

SIGIR頂會論文解讀

精彩內容搶先看

image.png
1、對抗推薦系統
回顧推薦系統的發展,離不開模型、數據、訓練方式三個維度的創新。模型層面,基於內容的推薦系統到協同過濾的矩陣分解,以及神經網絡帶來的序列化建模,使得用戶表徵和商品表徵刻畫越來越精細;數據層面,長短期行為的切分,基於session 的推薦 [1],跨場景行為的引入,數據的豐富和建模為用戶興趣的挖掘提供更多的可能;訓練方式上,分佈式訓練框架,在線學習,高維稀疏特徵處理,優化器設計,從而支撐商業化推薦系統。然而,性能提升的同時,我們也看到推薦系統的可解釋性逐漸變成黑盒。用戶的興趣偏好如何表徵,興趣如何演變,不同時間點的歷史行為由哪種因素主導,這一系列的問題都對現代化推薦系統的解釋提出了挑戰。
2、GMCM基於微觀行為圖的成交轉化模型
電商推薦系統幫助用戶尋找感興趣的商品。在這個系統中,兩個任務扮演了至關重要的角色,點擊率預估(CTR Estimation)和成交轉化率預估(CVREstimation)。顧名思義,點擊率是商品從被曝光到被點擊的概率,成交轉換率是商品從被點擊到被購買的概率。
雖然學界和業界在 CVR預估方面做了不少有意義的工作,但是工業應用中的 CVR預估仍然是個有挑戰性的任務。
3、屬性二部圖的表示學習
網絡數據是一種常見的數據表示形式,可以用來建模現實世界中的多種應用場景。網絡表示學習(又稱作圖嵌入學習),作為一種建模網絡數據的模型,近年來受到學界和工業界的廣泛重視,得到了極大發展。網絡表示學習旨在把複雜的網絡圖數據結構嵌入到低維的連續向量空間中,並且使每一個節點的特徵信息在低維空間中得到反饋。近年來,大量的網絡表示學習方法和模型被不斷提出並且在鏈路預測、節點分類、網絡可視化等相關的實際任務上有很好的表現指標。
4、瞭解電子商務中的迴音室效應
個性化推薦系統在為用戶帶來更精準商品的同時,也對消費者的興趣偏好和行為造成影響,例如迴音室效應。迴音室是指用戶不斷接受相似的信息和內容, 從而使得他們的興趣或者態度被不斷強化。這種現實通常出現在社交媒體和網絡平臺,也同樣可能出現在電子商務等推薦系統中。我們的研究集中在電子商務的推薦系統對用戶興趣的影響,利用淘寶的大規模用戶數據檢驗是否存在迴音室效應。
5、基於post-click行為分解的全空間多任務轉化率預估建模
隨著移動互聯網的興起,從海量的數據中挖掘出有價值的信息並呈現給用戶,已成了電商、社交、新聞等主流應用的核心功能,推薦系統正是在這樣的背景下誕生的。在電商領域,高質量的推薦系統能為用戶提供精準、及時、甚至帶有一定驚喜性的個性化服務,進而有效地增加了用戶與系統之間的黏性,同時也能為平臺帶來一定的收入。一般說來,電商領域 ( 如淘寶 ) 的推薦系統架構主要包括兩個階段:系統決策和用戶決策。
6、一種挖掘用戶評論文本的跨領域冷啟動用戶推薦網絡
在大型推薦場景中,存在著眾多類目(例如亞馬遜平臺中的書籍、影視推薦等)。用戶往往只與其中部分類目有過交互,對於其他類目,由於缺少相應的歷史行為記錄,協同過濾方法會遭遇冷啟動問題。
為了緩解冷啟動問題,一類可行的方法為利用用戶在其他類目上的歷史交互記錄進行知識遷移(跨領域推薦),比如,給喜歡武俠小說的用戶推薦古裝電影。同時,為了更細緻地刻畫用戶形象,參考用戶的歷史評論進行輔助推薦也能起到促進作用。
近年來,跨領域推薦和基於評論的個性化推薦均取得了不俗的進展,卻鮮有工作將二者結合。這類工作主要存在以下挑戰:1)用戶在不同類目下的關注點是不同的,且只有少量稀疏特性存在關聯,導致模型較難發現此類隱式關聯;2)對於在當前類目下無歷史記錄的冷啟動用戶,若直接利用其他類目下該用戶的評論文本,則會不可避免地帶來用戶特徵的抽取誤差,例如,喜歡粗糙質地工藝品的用戶,不一定會喜歡粗糙材質的衣物。鑑別不同類目間評論文本的語義差異,也是一個不小的挑戰。
針對以上問題,本文提出了一種挖掘用戶在不同類目下的評論關聯,進而對冷啟動用戶進行推薦的深度模型,稱作CATN
7、全局自適應模塊:為召回模型裝上第三隻眼
DeepMatch在搜索、推薦和廣告等系統都大量應用,是一種重要的召回方式。通常將用戶 ( 搜索場景下包含 Query) 和商品通過深度模型編碼成向量,線上通過向量近鄰查找 top K 個商品作為召回結果。

再附下載地址:https://developer.aliyun.com/topic/download?id=724

藏經閣系列精品保證

本書為阿里雲開發者社區 “藏經閣” 系列圖書。開發者技術精品“藏經閣”,超全阿里系電子書開放下載,覆蓋 Java、物聯網、雲原生、前端、大數據、開源、AI 、小程序 等技術知識,深度分享阿里工程師實踐精華,頂級技術內容一鍵獲取:https://developer.aliyun.com/topic/ebook

開發者藏經閣.jpg

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top