一定是CTRL+U的東西。
就正確來說。就是初始的HTML文皁內容。
因為~~~爬蟲並不會去執行 JS 的程式。
所以一些靠JS渲染出來的畫面。並不會出現。
至於要如何取得渲染後的網頁資料,這又是另外一門學問就是了。
請問您說的爬蟲並不會去執行 JS 的程式-->是只有Google,還是其他搜尋引擎都是這樣?
這個講法不一定正確,因為Google有可能有試著執行JS,但可預期的是它也不會花太多時間去執行
只抓http/https傳回的網頁,會無法取得用戶端經由JavaScript動態產生的網頁內容。這樣不利於搜尋,因此後來衍生出"How to SEO for JavaScript Websites"
正常來說,幾乎目前所有爬蟲大多是這樣。
但其實我上面也說了,還是可以用特別的方式去做爬蟲來拿到渲染後的網頁。
其實你也可以用POSTMAN去模擬查看。
像現在使用的SSR/CSR就是為了應付搜尋渲染後的網頁。
我覺得google 兩者都有只是兩件事情目的不一樣
google 有網頁分析 的工具 換句話說 他一定有頁面 渲染後的爬取
另一種它是大資料分析 他會用設定好的tag標記 加json/schema 做分類 建索引
以上都可能 我用推論的....
不然 可能擲筊更快