Favicon02

Google Search Console 網頁索引報表:理解網站索引問題細節

只要你的網站在運作、有申請 Google Search Console,那麼你一定會碰到「網頁索引報表」的相關問題。

只要你的網站在運作、有申請 Google Search Console,那麼你一定會碰到「網頁索引報表」的相關問題。

由於「網頁索引報表」裡面很多專有名詞,讓很多人看到這份報表都會很緊張。

因此,我下面會有更好懂、更白話的方式,來解釋這份「網頁索引報表」。


以下內容部分源自於 Google 官方《網頁索引報表》,當你在 Google Search Console 碰到索引問題,就可以從下列的資料進行尋找。

在 Google 的官方內容作為基礎上,我會針對每個內容做一些補充跟解釋,讓你比較容易看懂、並且知道該怎麼處理。

如果解決方案如果牽涉到技術修正,則會寫的比較簡略一點,你能理解要找誰討論、討論什麼問題即可。


網頁索引狀態報表在哪

我們可以在 Google Search Console 的「產生索引>網頁>網頁未編入索引的原因」找到索引報表。

這裡會說明哪些網頁、因為什麼原因,所以不能被索引。

2023 09 23 2

延伸閱讀:《SEO 自學大全:一篇就搞懂 SEO,完整說明 SEO 的底層邏輯


索引問題排除大原則

這邊先介紹當我們碰到索引問題時,四個很重要的基本技巧。


1. 搜尋一下具體問題

在報表中,Google Search Console 都會標註出這是什麼問題,碰到問題別害怕,請先嘗試 Google 看看。

像是報表出現「替代頁面 (有適當的標準標記)」,那就 Google 一下「替代頁面 (有適當的標準標記)」,點開幾個搜尋結果跟教學,你會驚訝的發現:原來大家都把解答給你了。

也可以直接問 ChatGPT,他也都會回答你。


2. 記得點進去問題裡面的網址

像是前面的問題「替代頁面 (有適當的標準標記)」,我們可以點進去這個問題的頁面裡面,裡面會告訴我們「是哪些網址發生問題」。

當我們點開有共通問題的五、六個網址,有時候我們就能稍微感覺到這幾個頁面的共通點,有的時候也會發現某些網頁就算出問題也不算問題。

而這些點開的網址,右邊也都會有一個「網址檢查」的按鈕,我很鼓勵你按下去,裡面會有很多的技術線索。

接下來我就會介紹常見的索引錯誤情境,看完這些內容後,相信你對於 Google Search Console 的報表恐懼感會降低很多。


3. 有些問題不是問題

不是每個出現在索引的問題都是問題,所以你需要掌握 SEO 的基本概念,才不會看到這個報表出現通知就很緊張。

有一些通知他一定要告訴你,但顯然不是大問題。


4. 問題排除完,按「驗證修正後的項目」

當你認為把問題都排除完了,像是 Google 說我的網頁上面有 noindex 所以不能索引,那如果我把這些網頁的 noidex 都移除了,我要怎麼讓 Google 知道我改過自新了呢?

我們需要在 Google Search Console 的欄位按下「驗證修正後的項目」,這就是重新交卷、補考的概念,Google 後續就會去盡快審核,評估原本的問題是否有改善。

但如果你的問題完全沒改善,你卻一直按驗證,這對網站沒有任何好處,請不要這麼做

2023 09 23 1


爬取障礙:常見索引錯誤情境

下面這些索引錯誤的情境,多半跟爬取錯誤有關,也就是搜尋引擎無法順利爬取網頁內容。

我們一直強調:沒有爬取,就沒有索引,以下這些問題都是因為沒辦法正常爬取導致的。

延伸閱讀:《爬取是什麼?


1. 伺服器錯誤(5XX)

Google 要求存取網頁時,你的網站伺服器傳回 500 層級錯誤。包含 500、502、503 錯誤,這些錯誤代表你網站伺服器出了問題,網頁根本無法索引,自然沒辦法談論索引。

若 5XX 的錯誤發生太久、太常發生,會讓 Google 降低網站爬取頻率,因為這代表這是一個壞掉的網站。

解決方式:與網站工程師、網站平台聯絡,修正伺服器錯誤。


2. 重新導向錯誤

Google 遇到下列其中一種類型的重新導向錯誤:

  • 重新導向鏈結過長
  • 重新導向迴圈
  • 重新導向網址最終超過網址長度上限
  • 重新導向鍊結中的網址無效或空白

透過 301、302 轉址,網頁網址會從 A 網址轉移到 B 網址,如果轉址轉太多層、太多次,或最後轉址到的網址是壞掉的,那這樣的網址就無法索引。

解決方案:請使用 Lighthouse 等網路偵錯工具,取得重新導向相關詳情。


3. 網址遭到 robots.txt 封鎖

網站的 robots.txt 檔案封鎖了這個網頁。

由於 robots.txt 是一個禁止爬取的設定,如果我們有網址符合被禁止的設定,自然就不會被爬取,也基本上不會被索引。

解決方案:調整 robots.txt 設定,把被封鎖的網址移除。

延伸閱讀:《robots.txt 介紹:什麼是 robots.txt?對於 SEO 有何效果?


4. 網址含有 noindex 標記

noindex 這個標籤顧名思義,「no」+「index」就是不要索引的意思。當一個網址上面被加上了 noindex,就代表不希望 Google 索引。

但如果你希望這個網址被索引,就應該移除 noindex 標籤。

解決方案:移除該網址上的 noindex 標籤。

延伸閱讀:《noindex 介紹:什麼是 noindex?對於 SEO 有何效果?


5. 找不到(404)

404 就是你一定看過的 404 Error、404 Not Found ,也就是網頁不能使用、網頁掛了的意思。

如果網頁掛了,並且回傳 404 給 Google,那 Google 當然不會索引這個網頁,因為壞掉的網頁沒必要索引。

因此 404 導致沒有索引,很有可能不是問題。

如果有問題,那問題應該是:為什麼這個頁面變成 404 了?這個才是問題。

解決方案:檢查一下這個頁面是否應該為 404,若應該是 404,那無問題;若不應該是 404,解決它。


6. 轉址式 404 錯誤(Soft 404)

有些網頁你點入畫面,會看到網頁明顯壞掉,或是已經顯示「找不到」、「此頁面無法使用」,換句話說,這個網頁對於使用者來說是壞的。

同時,這個網頁卻傳回 200 的 HTTP 狀態碼給 Google,意思代表:此網頁是可以正常使用的。

但此時 Google 發現這個頁面內容是不能使用的(不要意外,Google 能判讀網頁是否能正常使用),如果不能用的網頁,匹配到能正常使用的 200 狀態碼,這個矛盾就叫做 Soft 404。

這種矛盾的狀態,我們會稱呼 Soft 404,中文叫做軟性 404、轉址式 404。Google 當然不喜歡這種狀態,因為這代表他要浪費資源去爬取這些「看似正常的」網頁。

這種頁面也不會獲得索引的機會,也會浪費網站的爬取資源,建議要調整成真正的 404。

解決方案:將不能使用頁面的 HTTP 狀態碼,從 200 改為正確的 404,有出現此狀況請跟網站工程師討論。


7. 因傳回未經授權的要求(401)而遭到封鎖

401 Unauthorized(401 未授權)代表這個網頁對搜尋引擎提出授權要求,沒有得到授權就不能爬取,所以 Googlebot 無法爬取內容,自然無法索引內容。

解決方案:允許使用者跟 Google 瀏覽此頁面,除非這個頁面不應該被使用者跟 Google 瀏覽。


8. 因拒絕存取 (403) 而遭到封鎖

HTTP 403 代表客戶端不能存取網站,也就是 Google 跟使用者都不能觀看網頁內容,自然無法建立索引。

解決方案:如果這個網頁應該被使用者跟 Google 觀看,那就開放權限、不需要驗證權限即可瀏覽,移除 403。


9. 遭到網頁移除工具封鎖

Google Search Console 有個功能是將特定的網址從 Google 搜尋引擎移除索引。如果執行,就會顯示「遭到網頁移除工具封鎖」,那麼此網址沒有被索引也就是理所當然的事情了。

移除網址工具位置:Google Search Console>左側欄位>產生索引>移除網址

解決方案:如果你希望此網址被索引,可以去「移除網址工具」取消要求。


工商時間

如果你想要更系統化、更輕鬆的學好 SEO,推薦你參考我與知識衛星合作的 SEO 線上課程《SEO 排名攻略學:從產業分析到落地實戰,創造翻倍流量》。

這是我的 SEO 集大成之作,讓你從入門到精通,附贈實戰模板跟檢核表,讓你真正學好 SEO。


內容問題:常見索引錯誤情境

網站爬取如果沒問題的話,一定就能被索引嗎?顯然不是。

以下列出的問題,都是有正常爬取,但 Google 不願意索引的內容,比起明確的技術問題,這種曖昧的狀況反而是更讓人頭痛的,接下來讓我們來一一破解。

延伸閱讀:《索引是什麼?


1. 已檢索 – 目前尚未建立索引

這個意思是 Google 已經爬取過網頁了,但目前不想索引你。

這個「已檢索 – 目前尚未建立索引」可以說是最麻煩的狀況,簡單來說就是 Google 基於種種神秘的理由,認為我們的內容不配被索引。

換句話說,就是內容不夠好,不值得被索引,那麼改善作法就是改善內容。

以下我提供粗略的解決方案,大原則就是提供讀者有幫助的內容,並且常更新,讓 Google 認為你的網站、網頁是值得提供給讀者的。

解決方案:

  • 先確認裡面的網址是否值得被索引,對於使用者有價值嗎?
  • 你的網站有使用不正當的黑帽手段嗎?
  • 如果你認為內容對使用者有價值,但沒有被索引,那就需要調整網頁內容
  • 建議新增內容、改寫部分內容、增加內部連結跟外部連結,讓這篇內容變得更加充實且有用
  • 可以嘗試重新發布改寫過的內容,並刪除舊的網址
  • 等待 Google 的臨幸

2. 已找到,目前尚未建立索引

這個情況是指:Google 已找到網頁,但尚未進行爬取,也就是說 Google 知道有這個網址,但預期會造成該網站的流量超載,還沒有實際爬取網頁,自然就沒有索引了。

解決方案:

可以先觀察一下,如果 Google 一直沒有來爬取,那代表可能網站的爬取預算(Crawl Budget)太少了,可以嘗試把一些完全不重要的網頁用 robots.txt 擋掉,或是提升網站主機的效能。

延伸閱讀:《robots.txt 介紹:什麼是 robots.txt?對於 SEO 有何效果?


3. 替代頁面(有適當的標準標記)

代表這個網頁是別的網頁的「替代頁面」(分身),也就是說目前被標註成替代頁面的網頁不是「標準網頁」(本尊)。很常見的狀況就是 utm,下面舉個例子。

我的這個網址「https://frankchiu.io/why-you-need-ebook/?utm_medium=facebook&utm_source=post&utm_campaign=fb-group-ebook-recommendation」被判定成替代頁面。

而標準頁面則是「https://frankchiu.io/why-you-need-ebook/」,因此上面那個後面帶有 utm 參數的網址就會被當成替代頁面,不需要被索引。

至於如何設定標準網址,可以參考《SEO Canonical URL 標準網址:利用”rel canonical”解決重複內容》。

解決方案:

  • 一般狀況都沒事,不用理會。
  • 除非有大量的標準頁面被判定成非標準頁面,那要看一下網站有沒有發生異狀。

4. 這是重複網頁;使用者未選取標準網頁

「重複網頁(Duplicate Content)」是指兩個頁面內容高度相似。

如果兩個頁面內容完全相同,這會被算成重複頁面;如果兩個頁面非常雷同,像是紅色的衣服、藍色的衣服,也有機會被判定成重複頁面。

為什麼 Google 不喜歡重複內容?

你可以想想看,如果今天 Google 一個關鍵字,結果 10 個搜尋結果有 6 個完全相同,這樣的搜尋體驗是不是很糟糕?這就是 Google 不喜歡重複內容、重複頁面的原因。

而「這是重複網頁;使用者未選取標準網頁」,意思就是 Google 發現有兩個重複網頁,但使用者(網站主)沒有設定哪個是標準頁面,哪個是替代頁面,這個時候就會由 Google 幫你選。

如果被 Google 當成非標準網頁,也就是替代頁面,就會被歸類到「這是重複網頁;使用者未選取標準網頁」。

解決方案:

  • 如果你認同這裡面的網址是替代網址,所以不用索引,那就沒問題
  • 如果你不認同 Google 挑選的標準網址,那可以透過 Canonical 這個方法來嘗試改變 Google 標準。

延伸閱讀:


5. 這是重複網頁;Google 選擇的標準網頁和使用者的選擇不同

這個情況是指:我們(使用者)認為某個網頁是標準網址,但 Google 不認為這個是標準網址,於是 Google 自己選了另一個更適合的網址當作標準網址。

如果要查看 Google 所選的標準網址,位置在「網頁索引」 > 「Google 所選的標準網址」底下。

如果要查看使用者(你)選擇的標準網頁,請前往「網頁索引」 > 「使用者宣告的標準網址」。

會出現「這是重複網頁;Google 選擇的標準網頁和使用者的選擇不同」,就意味著 Google 認為自己選的標準網址比較好。

你可以確認一下 Google 說的有沒有道理,以及網站為何會發生你認為的標準網址跟 Google 不相同這件事。

很常見的狀況是 Canonical 標籤設錯,又或是網站出現了重複內容,使得 Google 必須選擇其中一個網頁當作標準內容。

解決方案:

通常不會有大問題,但如果數量非常多的話,可以去看一下這些網頁發生什麼問題,為什麼會被我們當成標準網址,卻又被 Google 否認能成為標準網址。


6. 頁面會重新導向

這就是該網頁會轉址(Redirect)的意思,由於網址跳轉了,所以這個網址不會建立索引。

那麼轉址後的那個新網址會不會被索引呢?而這個就是新網址自己的事情了,它需要重新經歷 Google 的爬取跟索引檢測,如果通過就能被索引,這就跟舊網址無關。


小結:索引報表、索引問題,多看幾次就熟了

能把這個章節看完真是不容易,但這個章節真的很重要,因為索引是排名的前提,沒有索引就沒有排名可以討論了。

新手要一次掌握 10 多項問題並不容易,許多 SEO 人碰到這些問題也會要稍微 Google 一下找回清晰的記憶,因此新手對自己不用太嚴苛,先稍微看過有個印象就好了。

當你實際碰到這些問題時(只要你做 SEO,一定會碰到的),可以再回來看翻這個章節、去 Google 細節,碰過幾次就熟了,加油!


Google Search Console 相關文章


工商時間

如果你想要更系統化、更輕鬆的學好 SEO,推薦你參考我與知識衛星合作的 SEO 線上課程《SEO 排名攻略學:從產業分析到落地實戰,創造翻倍流量》。

這是我的 SEO 集大成之作,讓你從入門到精通,附贈實戰模板跟檢核表,讓你真正學好 SEO。

Frank Chiu
Frank Chiu

SEO 顧問、行銷顧問。協助本地企業與跨國企業導入 SEO 跟行銷方案,包括:雀巢、凱基銀行、大人學、居家先生、IKEA、Vocus 等。

訂閱電子報