大數據

瞭解電子商務系統中的迴音室效應 | SIGIR論文解讀

新零售智能引擎事業群出品

代碼:https://github.com/szhaofelicia/EchoChamberInEcommerce

一. 前言

個性化推薦系統在為用戶帶來更精準商品的同時,也對消費者的興趣偏好和行為造成影響,例如迴音室效應。迴音室是指用戶不斷接受相似的信息和內容, 從而使得他們的興趣或者態度被不斷強化。這種現實通常出現在社交媒體和網絡平臺,也同樣可能出現在電子商務等推薦系統中。我們的研究集中在電子商務的推薦系統對用戶興趣的影響,利用淘寶的大規模用戶數據檢驗是否存在迴音室效應。
根據迴音室效應的定義,我們分兩步檢驗其影響。首先,我們將測量用戶的興趣是否被強化。如果用戶興趣確實被加強, 接下來我們觀察強化效應是否是接收的內容造成的,即系統推薦的商品被限制在逐漸縮小的範圍內。也就是說,我們同時需要檢驗是推薦系統中是否存在過濾氣泡的現象。我們在實驗中採用分組對比的方法,利用聚類算法和有效性指標從群體水平分析用戶受到的影響。實驗結果證明電子商務系統,即淘寶平臺,用戶的點擊行為中的確出現了迴音室效應。然而, 這個現象在用戶的購買行為中被削弱了。

二. 迴音室和過濾氣泡效應的背景

迴音室(echo chamber)和過濾氣泡(filter bubble)效應都是個性化推薦系統造成的負面影響,這兩個概念並不獨立。迴音室效應[2]描述了由於不斷接觸相似的信息,用戶喜好被持續強化的現象,而過濾氣泡效應則解釋了推薦系統會把用戶隔離在一致,單一的信息環境中[5]。由此可見,過濾氣泡效應是造成迴音室效應的一種因素。
在社交媒體中,迴音室和過濾氣泡效應都會導致社會群體的分裂和觀點的極化[1]。很多研究集中在臉書,推特等平臺出現的迴音室效應,這些研究認為個性化的內容推薦造成了線上社群的極化和虛假內容的傳播 [3]。另一部分研究集中在推薦系統中的迴音室效應,他們利用模擬的數據預測推薦系統如何影響用戶興趣[2]。迴音室加劇了平臺內容的極化,而過濾氣泡效應則進一步降低了的多樣性。
然而,目前的研究仍存在一定侷限性。其中一個明顯的問題是很多結論不是基於實時數據而是仿真或是自定義的模型下的結果。另外一個問題是很多研究混淆了迴音室和過濾氣泡的定義。很多研究將它們混為一談,或是隻研究其中之一回避了兩者的相關性。我們的研究解決了上述問題:一方面,在檢驗迴音室效應的同時也檢測可能造成其的因素,即過濾氣泡效應;另一方面,來自淘寶的實時數據使我們不必使用仿真去驗證推薦系統對用戶的影響。

三. 研究問題和解決方案

我們的目的在於研究電子商務推薦系統對用戶影響。不同於社交媒體和其他類似的平臺,用戶的興趣偏好在電子商務系統更加多樣和複雜。例如在社交網絡中,我們可以將用戶的觀點歸類為正反兩個的方向,即支持和反對,觀察任一方向的強化即可驗證系統對用戶偏好的影響。但是在電子商務中,用戶的喜好圍繞各類商品,多種類型的產品導致我們無法用“正反”來定義用戶的興趣。電子商務中的用戶行為也為我們的研究增加了難度,我們很難觀察到評論,添加刪除好友等社交網絡中具體明確的行為。用戶和平臺的交互以間接的方式構成推薦系統和用戶的相互影響,因而我們的測量只能利用購買,瀏覽,點擊等用戶的歷史記錄。基於以上兩個特徵,我們選擇測量群體水平的變化,利用聚類的方式分析用戶興趣特徵,並觀察群體水平推薦內容的多樣性變化趨勢。我們的方法可以總結為以下兩個問題:
(1) 我們測量一段時間內用戶喜好的變化,判斷用戶興趣是否被強化。
(2) 如果用戶興趣的確得到加強,我們接下來檢測這是否是因為用戶接觸的內容被限制,多樣性降低。
我們採用已有研究中的方法[4],利用分組的方式,根據用戶採納推薦商品的頻率將用戶分為採納推薦組(Following Group)和不採納推薦組(Ignoring Group)。對比兩組的結果,我們可以觀察到推薦系統對用戶的影響。以上方法有效地檢測電子商務場景的迴音室效應,論文的貢獻具體為以下幾點:提出群體水平 的聚類分析方式;根據用戶行為分組,從而測量回音室的影響;我們的實驗使用實時用戶數據,並分別研究了用戶點擊,購買行為的變化。

四. 數據集

我們採用淘寶用戶的數據集,涵蓋86192用戶從2019年1月1日到5月31日共五個月的三種記錄:瀏覽,點擊和購買(表1)。我們只使用後三個月的數據以確保用戶已經熟悉淘寶平臺的各項功能。隨後根據用的clicked PV (clicked page review), 抽取出Following Group和Ignoring Group兩組用戶。我們將至少包含一個點擊商品的推薦列表定義為clicked PV,並計算全部PV中clicked PV的比例—PVR (page review ratio)。如圖1所示,PVR在20%以下的用戶歸入Ignoring Group,PVR在80%以上的用戶以下的用戶歸入Following Group。分組之後,我們共得到六組數據(表2)。
為了提取用戶興趣嵌入向量(user embedding)和產品嵌入向量(item embedding),我們將用戶記錄劃分為小區間(block)。每個區間包含相同數量的記錄,例如用戶的點擊,瀏覽和購買。通過比較三個月中第一個(first block)和最後一個區間(last block)的用戶興趣變化,我們就可以檢測推薦系統在這段時間造成的影響。採用目前最先進的方法之一[6],我們提取出產品嵌入向量(item embedding)用於測量內容多樣性,並計算每個區間的平均產品嵌入作為用戶興趣嵌入(user embedding)用於檢測用戶興趣強化。

image.png

表1 實驗數據

image.png

圖1. 用戶分組

image.png

表2 用戶分組數據

五. 測量方法和結果

(一) 測量用戶興趣強化程度
我們先用霍普金斯統計量(Hopkins statistic)確認每組數據都可以產生有效的距離結果,計算結果用H表示。這項指標代表了數據的聚集程度,當指標超過0.5時,數據集有聚類傾向,計算公式如下:

image.png

S¬¬i和t¬¬i分別表示採樣數據在隨機數據和待測數據集的最小近鄰距離。如表3所示,所有用戶組數據均有聚類傾向。

image.png

表3 霍普金斯統計量

由於我們採用k-平均演算法(k-means clustering), 我們需要為每組數據選擇最優的聚類數量,即K*。考慮到高維嵌入向量的複雜性,我們使用貝葉斯信息量準則(Bayesian information criterion,BIC)選取合適的K。BIC越高,說明K越適合數據集。貝葉斯信息量準則通常用於模型的最大似然估計,我們採用適用於切割式分群聚類的計算公式:

image.png

K表示聚類數量,ni表示聚類的大小,Σ表示方差,N為數據集大小。
image.png

圖2 BIC

.

各組數據的BIC曲線如圖2,點擊嵌入向量Following Group和Ignoring group的K分佈是24和20,購買嵌入向量Following Group和Ignoring Group的K分佈是11和9。由於峰值附近的的曲線較為平滑,我們把k的範圍擴展到[K-5, K+5],各組的範圍分別是[19,29],[15,25],[6,16]和[4,14]。
隨後我們分別測量各項k值下的聚類有效性指標(clustering validity index),CH(Calinski-Harabasz index)和ARI (Adjusted rand index)。
測量CH指標時,我們只對第一個區間的嵌入向量進行聚類,直接將結果應用在最後一個區間對應的嵌入向量,之後測量兩個區間的CH指標 (公式如下)。CH指標越高,聚類結果類間越分散,類內越聚集,聚類結果越好。在我們的實驗中,CH指標下降較少的用戶組則興趣強化的程度較高。SSBK和SSWk分佈表示類間和類內的平方距離,N表示數據集大小。
image.png

結果如圖3和表4所示,無論是點擊嵌入向量還是購買嵌入向量,Following Group的CH都下降較小,說明該組用戶興趣被強化。
image.png

圖3 CH

image.png

表4 各組用戶CH指標下降值

ARI的測量結果也印證了這一結論。不同於CH,ARI可以看做兩個不同聚類結果的相似度,通常被用來比較待測結果和最優結果的差距。ARI數值越高,說明兩個聚類結果越接近。我們利用ARI測量同組用戶前後兩個區間數據各自的聚類結果,估計嵌入向量的變化。ARI計算公式如下:

image.png

pi和qj分別表示不同聚類的數據,n¬ij表示兩個聚類i,j共同包含的數據。
從圖4和表5可得,Following Group的用戶興趣受到的影響更大。無論是點擊還是購買嵌入向量,Following Group的ARI都較高,說明聚類結果變化小。但是,購買嵌入向量的兩組ARI差距不大,並不顯著。

image.png

表5 各組用戶的ARI指標

image.png

圖4 ARI

(二) 推薦內容多樣性變化趨勢
基於聚類分析的結果,我們可以確定Following Group的用戶興趣的確被強化了。接下來我們檢測這一差異的原因,即推薦內容多樣性的變化。
我們通過計算每個用戶在同一區間內各產品嵌入向量的歐式距離(公式如下),利用同一區間的距離均值表示推薦內容的多樣性。平均距離越大, 說明推薦的內容越豐富。

image.png

之後我們計算同一組用戶區間的平均推薦內容多樣性,結果如表6和圖5 所示。儘管存在多樣性下降的整體趨勢,分組結果顯示只有Following Group存在推薦內容多樣性降低,Ignoring Group的下降並不顯著。

image.png

表6 推薦內容多樣性均值

image.png

圖5 各組用戶推薦內容多樣性的分佈

我們可以推斷,Following Group用戶興趣加強是由推薦內容多樣性降低造成的。

六. 結論

根據實驗結果,我們可以確定用戶興趣受到推薦系統影響,傾向於採納推薦產的用戶其偏好會逐漸增強。迴音室效應的出現正是由於用戶接觸的信息範圍變窄,推薦內容的多樣性逐漸下降。我們同時也觀察到迴音室效應在不同用戶行為中的程度並不一致。就點擊行為表現出的用戶偏好而言,這種影響較為明顯,但購買行為體現出的用戶喜好則較為穩定,迴音室現象一定程度被抑制。我們認為這是由於購買行為受到客觀因素的限制,用戶並不能完全依照興趣喜好消費商品。
我們今後的研究將基於這個結果,設計並構造能夠有效降低迴音室和過濾氣泡效應的推薦算法,為電子商務平臺的用戶帶來更有效多樣的推薦。

七. 參考文獻

[1] Pranav Dandekar, Ashish Goel, and David T Lee. 2013. Biased assimilation, homophily, and the dynamics of polarization. Proceedings of the National Academy of Sciences 110, 15 (2013), 5791–5796.
[2] Ray Jiang, Silvia Chiappa, Tor Lattimore, András György, and Pushmeet Kohli. 2019. Degenerate feedback loops in recommender systems. In Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society. 383–390.
[3] Sina Mohseni and Eric Ragan. 2018. Combating Fake News with Interpretable News Feed Algorithm. arXiv preprint arXiv:1811.12349 (2018).
[4] Tien T Nguyen, Pik-Mai Hui, F Maxwell Harper, Loren Terveen, and Joseph A Konstan. 2014. Exploring the filter bubble: the effect of using recommender systems on content diversity. In Proceedings of the 23rd WWW. ACM, 677–686.
[5] Eli Pariser. 2011. The filter bubble: What the Internet is hiding from you. Penguin UK.
[6] Jizhe Wang, Pipei Huang, Huan Zhao, Zhibo Zhang, Binqiang Zhao, and Dik Lun Lee. 2018. Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba. Proceedings of the 24th ACM SIGKDD (2018).

更多信息檢索技術內容請查看:獨家下載!《SIGIR 頂會論文解讀》電子書重磅發佈

Leave a Reply

Your email address will not be published. Required fields are marked *