開發與維運

Google 段落排名算法(Passage Ranking)全解讀

去年 10 月,Google 透露了幾個基於 AI 的新功能,其中包含了段落排名。2021 年 2 月,段落排名算法開始在美國正式上線了。
我認為這是影響深遠一個排序算法,因為很多信息型搜索和內容站的排名將受到影響,而且長期來看將對內容生態產生影響。

什麼是 Google 段落排名算法(Passage Ranking)

passage ranking1.jpeg
以上是 Google 原文中的排名算法的示例圖
對於具體的搜索詞,Google 會返回跟搜索詞主題最相關的網頁,而有一些大而全的網頁雖然包含相關的內容,但因為太全面,整個網頁的主題寬泛,反而獲取不到排名。

Google 段落排名算法,就是對於這批大而全的網頁,只要部分段落內容是跟搜索詞匹配,網頁的排名會有額外的提升。也即是在排名時,顆粒度將細化到段落。

Google 工程師 Martin Splitt 舉了個例子:
Google 會識別出每個網頁的主題,比如網頁 A 是土豆主題,網頁 B 是番茄主題。還有個非常豐富的網頁 C,包含了土豆和番茄的內容。這個被判斷為蔬菜主題。
在搜索排序時,Google 會找到一批主題跟 Query 匹配的網頁。比如當用戶搜索土豆時,就返回了土豆主題的網頁。
因為 Google 無法理解土豆和蔬菜的關聯關係,所以並沒有出現蔬菜的排名(即便包含土豆的內容),只會出現土豆的排名。
而通過段落算法,Google能識別出這個網頁是蔬菜主題,但其中一部分是講土豆的。因此會把這部分段落內容拿出來,參與到土豆的排名中。
我花了個簡單的圖:
20210303110958.jpg

2021/2/11 Google 段落排名算法已上線

Google 在 Twitter 宣佈:段落排名算法已經於 2021/2/11 在美國+英語範圍內上線,後續將在英語的其他地區、其他語言和地區上線。
20210303111042.jpg

注:後續上線情況將在博客和公眾號保持更新。

段落排名算法的預計影響

sensor.jpg
上圖是 Sensor 的排名監控情況,能看出段落算法上線時排名有明顯變化

Google 稱,整體上段落排名算法會對 7% 的搜索產生影響。更具體的影響有以下幾個方面:

  • 內容型網站將受到影響。段落排名算法主要針對內容,所以一些內容型網站將受到明顯影響。比如一個較短的文章之前在某個特定關鍵詞有排名,現在前面忽然插入了一個長文網頁的排名
  • 電商網站影響較小。因為電商網站的文本內容較少,段落排名算法無法生效,尤其是產品列表頁。產品詳情頁可能會有一些影響。
  • 長網頁有明顯利好。長網頁會有明顯的排名和流量的提升。因為算法就是針對那些有相關內容,但篇幅較長的內容
  • 信息型搜索影響明顯。因為信息型搜索一般都是內容型網站的結果
  • 長期來講,對內容生態有幫助。一方面對 SEO 編輯來講,日常會針對搜索詞來組織內容,有些內容一篇就能寫完的,為了命中搜索詞非要拆開,算法上線後就不需要拆開了;另一方面還有一批不太會 SEO,但有專業能力的寫作者,在算法上線前因為 Query 命中的問題沒有獲得應有的流量,算法上線後也會明顯受益。通過這兩方面,Google 在引導站長和寫作者更專注於內容質量。

Google 段落排名算法是按照段落索引?

search-engine-1.png
上圖是搜索引擎的簡單模型,本次段落算法主要影響索引檢索器這個部分,不影響索引構建部分
有人會問,Google是否將網頁打散為段落,改為段落去索引,然後去排名。
Google 的迴應是,並沒有對段落單獨索引,仍是以網頁維度索引和排名。不過段落內容會作為附加的排名因素
也就是說,Google 主要是做加法,在之前索引和排序的基礎上,如果有個網頁的段落內容命中了 query,在排名上會有提升。

針對段落排名算法,SEO 需要做什麼

Google 的建議仍是不需要做什麼針對性的改動。只是 Google 可以更好的理解網頁的內容,並且可以針對網頁的不同部分內容進行打分。
我的建議也是,對於 SEO 編輯來講,以後可以更專注於內容的生產,不用刻意的對內容進行分割

怎麼才能主動命中段落算法呢?比如文本內容多長才是段落?
Martin Splitt 說這個算法依賴算法和機器學習,所以一直在調整,並沒有固定的長度,可能是幾個詞,也可能是一句話。

另外,能否退出這個段落算法?
答案是否定的。這個排名是搜索結果中的自然排名,並不是插入的排名(Martin Splitt 的原話是,這個是 SERP 的藍色鏈接),所以無法退出

參考文檔

Leave a Reply

Your email address will not be published. Required fields are marked *