大數據

如何快速實現精準的個性化搜索服務

一、個性化排序應用

類目預測

類目預測是開放搜索裡基於物品/內容的類目信息改善搜索效果的算法功能
類目預測根據用戶的查詢詞來預測用戶想要查詢哪個類目的結果,結合排序表達式,可以使得更符合搜索意圖的結果排序更靠前
基本原理:把歷史上搜過的query收集起來,結合query查詢之後的點擊行為數據,與類目下的物品信息聯繫起來,使用這些數據來訓練模型,由模型來刻畫query與類目之間的數據規律。

例如:不同用戶搜索“華為”
有些行為意圖搜索“配件”,有些意圖是搜索“手機”,那根據用戶的行為數據就可以通過類目進行判斷,從而在排序效果上實現個性化展示;
image.png
image.png

二、個性化搜索引導

搜索中引導--下拉提示

功能介紹
下拉提示是搜索服務的基礎功能,在用戶輸入查詢詞的過程中,智能推薦候選query,提高用戶輸入效率,幫助用戶儘快找到想要的內容。
下拉提示實現了基於用戶文檔內容的query智能抽取,可以通過中文前綴,拼音全拼,拼音首字母簡拼查詢以及漢字加拼音,分詞後前綴,中文同音別字等查詢下拉提示的候選query。

例如:不同用戶在搜索框輸入“包”,下拉提示都是不同的,優先展示該用戶搜索過的query,從而增加業務轉化的機會;
image.png
image.png

• query生成規則
針對過去N(默認7)天的歷史query,結合該query的詞權重,召回結果數,歷史搜索次數,近一天查詢是否有結果等條件,選出一些熱門歷史查詢詞,作為下拉提示的候選詞。
系統支持兩種規則生成候選query:抽取生成和原值保留。
抽取生成:使用阿里nlp團隊基於海量自然語言訓練的分析器,對字段內容進行分詞,抽取有意義的term進行組合,得到候選query,這種方式儘量保證生成的候選query能召回對應的文檔。
原值保留:該規則對字段內容不做分詞處理,直接將其作為下拉提示的候選query。
• 行業模板
根據不同行業數據特點提供了相應優化模板:通用行業模板,電商行業模板,內容行業模板
• 干預功能
對數據源應用文檔設置過濾條件;對候選query結果進行干預,包括黑名單和白名單;
• 業務報表
下拉提示進行的數據統計指標包括:核心指標,流量指標,點擊指標, 引導搜索指標,Query分析指標,五個維度;
可以衡量下拉提示召回、排序、加購轉化、內容豐富度等效果。

搜索前引導-熱搜和底紋

• 功能介紹
熱搜和底紋是一個完整搜索引擎必備的基本功能,通常佔據著搜索框入口的重要位置,提供不可或缺的業務價值。
image.png

從用戶的角度來看,熱搜底紋一般可以滿足如下的需求:

  1. 給我推薦一些優質的查詢詞;
  2. 想知道大家都搜了些什麼;
  3. 既想看我感興趣的內容,又想探索一些興趣之外的內容;

從運營者的角度,熱搜和底紋可以提供這樣的價值:

  1. 哪些query被搜得最多,熱門query是用戶興趣的風向標,通過分析熱門query我們可以把握用戶的興趣走向,對制定運營策略;
  2. 給用戶推薦一些優質query;
  3. 給用戶推薦熱門query,一方面兼顧用戶體驗,另一方面給部分次熱門query增加曝光機會;

• 配置流程
image.png

• 業務報表
熱搜底紋業務運營報表,可以清晰反映搜索引導結果的點擊情況,衡量其召回、排序的效果和質量,再通過系統的評估服務,找到對應的問題原因和解決方案。


以上就是阿里雲開放搜索“個性化”搜索相關算法的應用介紹,如果您對搜索與推薦相關技術感興趣,歡迎加入釘釘群內交流~

image.png

【開放搜索】新用戶活動:阿里雲實名認證用戶享1個月免費試用https://free.aliyun.com/product/opensearch-free-trial

Leave a Reply

Your email address will not be published. Required fields are marked *