iT邦幫忙

2021 iThome 鐵人賽

DAY 6
0
IT管理

從 IT 技術面細說 Search Console 的 27 組數字 KPI 系列 第 6

從 IT 技術面細說 Search Console 的 27 組數字 KPI (6) :網頁

記得在日本的一本 SEO 書寫了一個很生動的範例,一間公司業績要成長,取決於業務員的數量,而網站的業務員就是網頁,沒有足夠多的網頁就不要去想業績,而好的業務員就像是好的網頁,除了要有夠多的網頁外也要有夠好的網頁。

上次說到在 Search Console 最重要的 KPI 是在一打開的第一頁概述就有,也就是成效:總點擊次數,因為這個數字很容易受到大環境的影響,甚至也包含是否是對使用者有價值的,若是 SEO 只用這 KPI 是很吃虧的。

因此會把流量當作是『最終外部 KPI』,這雖然是可以知道結果,但要如何達成絕不是單純的,而是有很多事情做到才行,因此須要一個直接去檢討的 KPI,這個不受外部與內容好壞影響,且對 SEO 有很大影響的,就是『網頁數』。

這個也是重要到在 Search Console 的概述,除了流量外的第二個區塊:涵蓋範圍,而這個涵蓋範圍包括兩個數字,一個是『有效網頁』以及『網頁含有錯誤』這兩項,當然這邊的有效頁面稱為『最終內部 KPI』,因為在還沒有談到好不好的頁面之前,頁面數是放再最前面的。

https://ithelp.ithome.com.tw/upload/images/20210906/20000065BWRm3XD9VA.png

從爬蟲到搜尋引擎收錄會有幾個步驟:

  1. 發現網址,有可能是從網頁上的連結或是 Sitemap 提供的連結,Google 就會去爬這個『新網頁/New Discover』或是『更新舊網頁/Refresh』。
  2. 當爬了之後,基本會有幾個很重要的要素: HTTP 的回應碼,canonical 的制式網址,metadata 的 robots 等等的幾個項目,當然若是這幾個環節有問題,就不會被收錄,其中也包含 robots.txt 等等的幾個項目。
  3. 若 Google 認為這網址有效之後,就會往下分析,有時會發現內容不夠多,或是內容重覆的會被排除『檢索而未索引』之類,但若沒有內容與格式的問題就會下一部的往『強化/Enhancement』下一步走。
  4. 強化就包含手機的有效性、AMP 的有效性、Schema 結構化資料或是 Rich Result 的強化這部份會影響到 Google 願不願意收錄或是直接發生錯誤。
  5. 當網頁足夠被索引收錄,也包含經過強化等等的檢驗,最後會推給使用者,使用者會回報使用者狀況,其中包含『CrUX/Chrome 使用者體驗回報』,會對這個網頁在 Core Web Vitals 做評分。

在這麼多的環節中,若有一個環節沒有好好的轉換過去,這數字就會每經過一個流程就隨之降低,當然有時損失是很難避免的,就像是網站小、時間短或許還好控制,但時間一久,網站越來越大,不太可能把任何錯誤歸零,但至少要做到是可知、可控,且不是因為系統性的問題一直在增加。

上面提到的頁面是從 Google 發現網址開始,而發現網址有兩種來源,一個是在網頁上有連結,無論是內部連結或是外部連結,另一個就是 sitemap。

這邊就會有一個很大家很容易忽略的問題:

網站到底要不要 Sitemap ?

當然 Sitemap 有其優缺點,Sitemap 有最大的優點,就是能夠讓 Google 找到這個網站的所有網址,尤其是網站一開始時交互連結沒建立好時,要讓 Google 索引到時最好的方式。

但 Sitemap 的問題更多:

  1. Sitemap 理論上是要來輔助 Google 找不到連結,但又想被 Google 收錄時的方法,但這邊有一個很大的問題,當一個網頁沒有任何其他網頁連到這個頁面時,我們稱為孤島頁面,這在 SEO 是相當不好的,甚至依現在的 SEO 觀點,包含不到 3 個其他網頁有連結到也算是不良好的孤島頁面。
  2. Sitemap 最糟糕的是包含到錯誤的頁面,這包含 404、noindex 等等的頁面,但有時隨著網站的發展,有些頁面都會被被刪除或是排除,此時就會發生在警告與錯誤時有一堆 sitemap 所造成的,而要避免這問題就是要維護好這些 sitemap,但實務上我們知道是不可能的,sitemap 往往是寫了就不會有人管的,畢竟這是常人看不到的。
  3. Sitemap 最常見到的問題不是包含到錯誤頁面,而是建立一大堆透過搜尋的方式所產生的頁面,這些頁面雖然不是錯誤,但也像第一點必然是孤島頁面,因為 Google 不會自己填入搜尋關鍵字去產生頁面連結,更不要說這一頁不會有連結。
  4. Sitemap 若是要輔助 Google 索引,更須要的是新網頁,但很多網站的 sitemap 不是動輒全站的網址全寫,也就是可能是上百萬筆的資料,要 Google 從這百萬筆資料很快找到新網頁是不可能的,因此大部份都會建議用最多三天內的 RSS 來取代 sitemap。
  5. 當然有人問現在 sitemap 已經有時間的欄位去輔助爬蟲去爬到最新的網頁,但大部份的 sitemap 頂多只是加上建議週期,加上時間的並不多,更不要說是有去維護 sitemap 了。

Sitemap 最大的問題是平常不會有人去看去檢查,這個幾乎是做給機器讀取的爬蟲看的,不會有任何 QA 或使用者通報說 sitemap 是有問題的,要工程師去修改維護,更不要說很多網站 sitemap 都是用套件所產生的。

https://ithelp.ithome.com.tw/upload/images/20210906/200000655ePvAUcw3p.png

有效頁面的來源上面這張圖是故意降低馬賽克的等級,讓大家看這網站的網頁位數比,可以看得出來即使不用 sitemap,Google 也是可以爬到大部份的網頁,這個等級是數百萬,而會用到 sitemap 主要是針對新網頁,Google News 的 sitemap,以及 Video Sitemap,這些都是為了加快與強化使用,並不是用來產生網頁或是給 Google 索引到所有的頁面。

這邊只好還是再說一次 SEO 的精義:找到有價值的讀者想要找尋或有意義的資訊,與用對的訊息文字讓其點閱。


上一篇
從 IT 技術面細說 Search Console 的 27 組數字 KPI (5) 流量:新聞與探索
下一篇
從 IT 技術面細說 Search Console 的 27 組數字 KPI (7) :網頁的排除
系列文
從 IT 技術面細說 Search Console 的 27 組數字 KPI 30

尚未有邦友留言

立即登入留言