閒魚技術-仝輝
背景
閒魚在這幾年的高速發展中,積累了幾億件在線商品,而這些商品稂莠不齊,可能會帶來買家不好的購物體驗。因此,我們希望引入閒魚商品理解的能力,選取優質商品,進而提升閒魚的購物體驗。
痛點
現有的閒魚商品存在一些痛點:
1)賣家屬性: 閒魚上以個人賣家為主,存在著賣家長期不在線等情況,導致無法正常交易。
2)商品屬性:存在著劣質商品、商品引流和重複鋪貨等問題。
3)價格屬性:存在虛假標價、性價比低等問題。
4)供需關係:閒魚商品存在著大量的供需不平衡商品。

針對這些痛點,從以上四個維度去理解閒魚商品,並根據理解的內容進行選品。
商品分層維度
商品屬性
新品屬性:描述品牌信息,sku/spu/型號等。
二手屬性:用於估算商品的折損情況。這個不同的類目都不一樣,例如個護美妝類目的購買日期、餘量等屬性。手機是購買日期、屏幕是否破損、是否有劃痕等。

現有的新品屬性和二手屬性覆蓋率並不算高,我們後續會通過用戶引導和算法關聯的方式,持續提高商品屬性的準確率和覆蓋率。這也是後續分析供需關係和價格屬性的基礎。
此外,我們在商品屬性側也會判斷,是否包含色情、劣質、引流和重複鋪貨的情況,並對這些商品做相關的治理。
供需關係
下圖是經典的供需曲線,其中D線表示需求曲線,S曲線表示供給曲線。我們把供求相等的點E定義為均衡點,把與E點相對應的價格水平定義為均衡價格(P)即供求平衡時的價格;把與E點相對應的產量定義為均衡產量Q。即供求平衡的產量。

同樣的,閒魚的商品存在著大量供需不平衡的情況。例如,女裝類目商品大量堆積,供大於求;手機類目商品消耗比較快,供小於求。通過分析閒魚商品的供需關係和商品屬性,我們可以知道商品在特定類目,特定品牌和特定折損情況下對應的供需情況。針對這些情況,我們可以緩解閒魚商品積壓的情況,也可以對一些供小於求的商品做補貨。
價格屬性
二手平臺買家的主心智是希望買到低價、高性價比的商品。通過商品屬性分析得到的新品屬性和二手屬性,我們可以知道閒魚這件商品的價值和它在同類商品中的性價比。這樣我們可以知道這件商品的“價值”,從而可以更好的指導“價格”,也可以分析得出這件商品是否是有競爭力的商品。
賣家屬性
賣家屬性包括活躍率、回覆率、賣出率、糾紛率、好評率等。
閒魚本身的特殊性--閒魚以個人賣家為主,試想如果賣家不在線,不回覆或者不願意發貨,那麼正常的交易流程是不可能完結的。因此,賣家屬性是商品是否可以被正常賣出的必要條件,該屬性也是商品屬性裡比較重要的一個環節。

商品分層實現
商品理解
我們從上述四個商品維度去分析商品,找到這些商品維度相關的因子並設計商品信息指數、供需指數、價格指數和賣家指數,使得這四個指數與主指標(例如曝光支付率、動銷率等)成正相關關係。

最後將這幾個指數做迴歸分析,最終加權得到優質商品分。下面的餅圖就是得到的優質商品分(比例僅做展示使用)

優質商品選取
那麼有了優質商品指數,如何選取優質商品的?
我們會定義目標和限制條件,例如我們選取的優質商品分最高,且商品數量選取2000萬,也希望商品類目均衡,且不能有太高的糾紛率。那麼就轉化成一個組合優化問題:
定義目標
Target Max(優質商品分)
定義限制條件
s.t. 商品數量 <= 2000萬
s.t 葉子類目商品均衡
s.t. 糾紛率 <= 0.3%
求解該組合優化問題即可得到優質商品池。
數據回測
數據回測的目的是希望我們的效果在過去的一段時間內都得到驗證。如果選擇一個月的時間作為回測週期,我們會回測優質商品的主指標和大盤平均值的差異,如果連續一段時間都優於大盤水準,那麼可以證明選出來的優質商品是好於普通商品的。
仿真系統
如果說數據回測是希望驗證“過去”選品的效果,那麼仿真系統是預估優質商品策略上線之後對“未來”產生的影響。

仿真系統的想法是結合之前分析所得到的初級、中級和高級知識,預測策略上線後的結果。
其中:
初級知識指的是特定活動得到的知識,例如男性、20~30歲的人群對該活動更感興趣。
中級知識指的是一類活動得到的知識,例如紅包活動對某類人群效果更好。
高級知識指的是更加泛化的知識,例如購買對活躍的影響等。
結果
閒魚商品分層選取的優質商品,已經應用在了閒魚的新用戶首購、閒魚大促等場景,點擊率和購買率等指標有了明顯的提升。點擊率最高有了相對20%的提升,互動支付率最高有了相對100%提升。(考慮到數據安全,不公佈具體效果指標)
展望
本文介紹了閒魚商品的知識理解部分,我們後續會持續完善閒魚商品分層體系,同時希望持續和運營同學一起配合,挖掘更多商品知識,並錄入到閒魚商品知識庫,並通過用戶引導,擴大閒魚優質商品的數量,從而進一步提高用戶體驗。