Google專利:透過知識增益(Information Gain)系統探索SEO策略

文章目錄

分享給更多人知道

知識增益對SEO的啟發

以下為依個人經驗所揣測的SEO作法,可能並不為Google演算法所採用。

  • 知識增益系統可能是Google用來衡量網頁內容對搜尋字詞的相關性(Relevance)及原創性(Originality)的方法。
  • 與其複製其他網站的內容,不如專注於寫出有深度、獨特的內容,提供使用者在其他地方無法獲得的資訊。
  • 專注於使用者的閱讀體驗,鼓勵使用者互動,例如評論、分享等,可以提升網站的使用者黏性與權威性。
  • 規劃良好的網站內容結構,確保不同頁面之間主題關聯性強,可以幫助搜尋引擎更能理解網站內容,提升相關性分數。
  • 利用資料分析工具,例如Google Analytics,追蹤使用者行為,了解哪些內容較受使用者歡迎,並進行針對性最佳化。

什麼是知識增益 (Information Gain)?

在資訊爆炸的時代,我們每天都面臨著海量的資訊。搜索引擎長久以來都是我們獲取資訊的重要工具,但如何從浩如煙海的資料中找到真正對我們有價值的內容,卻成了Google的一個巨大的挑戰。這正是「資訊增益」技術應運而生的原因。資訊增益,顧名思義,指的是新資訊帶給我們的價值。

在Google搜尋引擎的情境下,它代表著一個網頁相較於使用者已經看過的內容,能提供多少新的、有用的資訊。通過計算資訊增益,系統可以更好地理解每份網頁的價值,並優先推薦那些真正能幫助使用者拓展知識、解決問題的內容,避免重複或無關資訊的干擾,讓使用者在資訊的海洋中,更快、更準確地找到自己的所需。

資訊增益系統運作原理

Google專利:知識增益系統 (Information Gain System)
Google專利:知識增益系統 (Information Gain System)
  • 首先,系統會根據使用者感興趣的主題和使用者已瀏覽過的網頁,找出第一組相關的內容 (步驟 505)。
  • 接著,系統會找出第二組同樣與該主題相關,但使用者尚未瀏覽過的內容 (步驟 510)。
  • 接下來,系統會為第二組的每篇內容計算一個資訊增益分數 (步驟 515)。
  • 然後根據這些分數,從第二組中選擇一個新的網頁內容 (步驟 520)。
  • 最後,系統會將所選中的新網頁提取出來呈現給使用者 (步驟 525)。

資訊增益背後的推手

那麼,系統是如何判斷資訊增益的呢?答案就是機器學習。機器學習模型通過分析大量的數據,學習理解用户的喜好和網頁的相關性。這些數據可能包括使用者過去的搜尋記錄、瀏覽過的文章、停留時間等等。

通過分析這些數據,模型可以逐漸掌握使用者的興趣,以及不同網頁的主題和內容。從而判斷哪些新資訊能夠帶來更大的價值。換句話說,機器學習模型就像是一位經驗豐富的閱讀者,它可以快速地瀏覽大量網頁,並根據用户的閱讀歷史和興趣,判斷哪些新網頁能夠提供更多新穎、有用的資訊。

讓機器讀懂文字

為了讓機器學習模型能夠理解網頁內容,我們需要將內容轉換成機器可處理的形式。常見的一種方法是將其表示成語義向量(Semantic Vector)或嵌入(Embeddings)。這就好比為每一篇網頁內容創造一個獨特的「指紋」,用以捕捉內容的語義和上下文。語義分析技術在這個過程中扮演著重要的角色,它幫助機器理解句子和短語的含義,以及它們在不同語境下的微妙差異。

相似度與新穎度分析

有了語義向量之後,機器學習模型就可以開始比較不同的網頁,評估它們在主題和資訊方面的相似程度。一種常用的方法是計算語義向量之間的「距離」。距離越近,說明兩個網頁的內容越相似;距離越遠,說明它們的內容差異越大。此外,模型還會使用 TF-IDF等技術來識別網頁中的獨特資訊。TF-IDF會根據詞語在網頁集中出現的頻率,賦予每個詞語不同的權重,幫助模型判斷哪些詞語更能代表網頁的核心主題。

計算資訊增益分數

資訊增益分數的計算方式有很多種,常見的方法包括: 

  • 基於向量距離:此方法將資訊增益分數設定為網頁相似度的反比。換句話說,兩篇內容差異越大,它們之間的資訊增益分數就越高。 
  • 基於新穎度:此方法根據網頁中的獨特資訊量來計算資訊增益分數。網頁包含的獨特資訊越多,其資訊增益分數就越高。 
  • 結合上述兩種方法:此方法綜合考慮了網頁相似度和新穎度兩個因素,以更全面地評估資訊增益。

整合資訊

資訊增益分數是搜索引擎提供排序和推薦網頁的重要依據。通過優先推薦資訊增益分數較高的網頁,系統可以確保使用者首先接觸到那些最有可能提供新知識、解決問題的內容。這樣一來,使用者便無需浪費時間瀏覽大量重複或無關的資訊,從而提升獲取資訊的效率和滿意度。

為什麼資訊增益對 SEO 至關重要

Google 的目標是為使用者提供與其查詢關鍵字最相關的結果。因此能用高品質的內容,來滿足使用者意圖的網頁,更有機會獲得較高的排名。

高品質的內容能不僅能夠解決使用者的問題,還減少使用者需要回到搜尋結果頁面尋找更多資訊的次數,此行為又稱彈跳式搜尋 (Pogo-sticking)。

而優質內容必定是透過投入大量時間,進行充分研究的內容,這也會為這個網站樹立起權威及專業度,從而獲得使用者和搜尋引擎的信任。

資訊增益的關鍵要素

  • 相關性:內容應與使用者的搜尋關鍵字高度相關。
  • 深度和廣度:全面涵蓋主題,包括不同的面向和細微差異。
  • 準確和可靠性:從可信賴的來源提供準確且經過充分研究的資訊。
  • 原創性:提供新的見解或以新穎的方式呈現資訊的獨特內容。

資訊增益在數位時代的重要性

資訊增益技術的出現,幫助我們更好地管理和利用資訊。它通過機器學習,讓搜索引擎能更理解我們的需求,並提供更具價值的內容。隨著技術的持續發展,資訊增益將在我們獲取和消化資訊的過程中扮演越來越重要的角色,幫助我們更有效率地探索知識、解決問題,並最終從資訊的海洋中受益。

Lewis Ko
Lewis Ko
Hi 我是Lewis,曾任職in-house行銷人員,現職某跨國企業的SEO Specialist。熱愛學習最新的科技和知識,努力透過簡單易懂的方式,分享我學習的過程和心得。如果你/妳剛好也在學習SEO、GA、GTM、Looker Studio的道路上,希望我的內容對你有幫助!

延伸閱讀