78.詞頻-倒文件頻(TF-IDF):是 Google 排名因素嗎?

TF-IDF

了解什麼是 TF-IDF,它是如何工作的,為什麼它是 SEO 詞典的一部分,最重要的是——谷歌是否將它用作排名因素。

TF-IDF 的效果是什麼,它真的可以幫助您的 SEO 策略嗎?

你會想,“那些瘋狂的 SEO 人……他們接下來會怎麼想?”這是可以原諒的。

但這不是這位思想領袖或試圖創造一個新短語的案例。

在本章中,您將了解 TF-IDF 是什麼、它是如何工作的、為什麼它是 SEO 詞典的一部分,以及最重要的是——Google 是否將其用作排名因素。

聲明:TF-IDF 是一個排名因素

如果你想了解更多關於這個主題的信息,你會看到一些瘋狂的頭條新聞,這些標題會讓你感覺自己錯過了今年沒有為 TF-IDF 分配預算:

  • 用於 SEO 的 TF-IDF:什麼有效,什麼無效。
  • TF-IDF:SEO 沒有使用的最佳內容優化工具。
  • TF IDF SEO:如何使用 TF-IDF 粉碎你的競爭對手。

TF-IDF 是您一直缺少的 SEO 策略嗎?

TF-IDF 作為排名因素的證據

讓我們從這個開始:什麼是 TF-IDF?

詞頻——逆文檔頻率是信息檢索領域的一個術語。

這是一個表示任何給定單詞對整個文檔集合的統計重要性的數字。

用簡單的語言來說,一個詞在文檔集合中出現的頻率越高,它就越重要,這個詞的權重就越大。

和搜索有什麼關係?

好吧,谷歌是一個巨大的信息檢索系統。

假設您有 500 個文檔的集合,並且您希望按照與術語 [rocking and rolling] 的相關性對它們進行排序。

等式的第一部分,術語頻率 (TF),將:

  • 忽略不包含所有三個單詞的文檔。
  • 計算 每個術語在每個剩余文檔中出現的次數。
  • 考慮文檔的 長度

系統最終得到的是每個文檔的 TF 圖。

但僅憑這個數字就可能存在問題。

根據術語的不同,您最終可能仍會得到一堆文檔,並且沒有關於哪個與您的查詢最相關的真正線索。

下一步,逆文檔頻率 (IDF),為您的 TF 提供更多上下文。

文檔頻率 = 計算文檔集合中的術語。

Inverse = 反轉最常出現的術語的重要性。

在這裡,系統從等式中刪除了術語 [and],因為我們可以看到它在所有 500 個文檔中如此頻繁地出現,以至於與該特定查詢無關。

我們不希望 [and] 實例最多的文檔排名最高。

[rocking] 和 [rolling] 權重最高的文檔,同時對文本長度進行規範化,更有可能與尋找 [rocking and rolling] 信息的人相關。

反對 TF-IDF 作為排名因素的證據

隨著文檔集合的大小和種類的增加,該指標的效用會縮小。

谷歌的約翰穆勒談到了這一點並解釋說

“這是一個相當古老的指標,多年來情況已經發生了很大變化。還有很多其他指標。”

我不認為這說明這不是一個因素。我認為他很清楚地說這不再那麼重要了。

儘管人們喜歡相信穆勒正試圖把一個人拉過來,但他不可能在這個問題上撒謊。

識別哪些文檔包含搜索者正在查詢的單詞是返迴響應的必要的第一步。

但話雖如此,這是一個舊的指標,它本身並沒有用。

在谷歌大小的索引中,TF-IDF 能做的最好的事情就是帶回數百萬或數十億的結果。

你能優化它嗎?

不。

嘗試針對 TF-IDF 進行優化意味著嘗試達到一定的關鍵字密度,這稱為關鍵字填充

不要那樣做。

儘管如此,這並不意味著這個概念對 SEO 專業人士來說無關緊要。

TF-IDF 作為排名因素:我們的判斷

絕對不是SEO因素

谷歌是否在其搜索排名算法中使用 TF-IDF——甚至可能作為其算法的基礎部分?

我們說絕對不是。

為什麼?因為它是一個古老的(在技術年代)信息檢索概念。

今天,谷歌有非常優秀的方法來評估網頁(例如,詞向量、餘弦相似度和其他自然語言處理方法)。

了解用戶正在搜索的單詞是否出現在文檔中以及出現頻率只是第一步。

對於初學者來說,如果沒有無數其他分析層來確定諸如專業知識、權威性和信任度之類的東西,TF-IDF 就沒有多大意義。

這意味著 TF-IDF 不是您可以用來優化網站的工具或策略。

您不能使用 TF-IDF 進行任何有用的分析,或者使用它來改進您的 SEO,因為它需要整個搜索結果語料庫來運行計算。

此外,我們已經不再只是想知道使用了哪些關鍵字以及如何使用它們以及出現了哪些相關主題,以確保上下文和意圖與我們自己的匹配

交替使用術語 TF-IDF 和語義搜索的 SEO 專業人士誤解了 TF-IDF。

它只是衡量一個單詞在文檔集合中出現的頻率。

底線:了解如何評估內容很重要,但這些知識並不總是會導致您的 SEO 清單上的另一個項目。

除非您正在構建自己的信息檢索系統,否則您可以將 TF-IDF 歸為過去的有趣事實並繼續前進。

文章來源:SearchEngineJournal 

關於SEJ:是全球第一SEO專業社群,SearchEngineJournal 於 2003 年成立,專精於SEO搜尋引擎行銷具有獨樹一格能力的專業人士,都來自全球各地真正實戰的SEO營銷專家,提供最新的SEO新聞和最佳實踐方式,提供教育和賦能 SEO 社群。

里揚SEO專業團隊

交給里揚SEO專業團隊

透過SEO優化提升業績吧!

立即預約行銷顧問諮詢

返回頂端