iT邦幫忙

2023 iThome 鐵人賽

DAY 23
0
AI & Data

30天網路爬蟲學習系列 第 23

DAY23-認識網頁設計技術與JavaScript(上)

  • 分享至 

  • xImage
  •  

網頁設計技術

網頁設計技術是一種程式設計,它建立的程式是為了產生HTML標籤,然後在瀏覽器顯示網頁內容。通常使用HTML標示語言建立的網頁內容只是一種靜態內容,無法和使用者進行互動或產生動態網頁。
舉例來說,Web網站需要搭配網頁設計技術才能建立互動與動態網頁。依照執行位置有分客戶端網頁技術和伺服端網頁技術。


  • 客戶端網頁技術:
    是只程式碼或標籤碼是在使用者客戶端電腦的瀏覽器執行,因瀏覽器內建直譯器,所以可以執行客戶端網頁技術。瀏覽器向Web伺服器請求網頁後,Web伺服器會將HTML網頁和相關客戶端網頁技術的檔案下載至瀏覽器的電腦,然後在瀏覽器執行應用程式。
    對於網路爬蟲來說,客戶端網頁技術最重要的就是JavaScript,我們需要判斷瀏覽器執行JavaScript程式以後,會不會影響欲爬取的目標資料,再來擬定策略擷取所需的資料。常的用客戶端網頁技術有JavaScript、Flash、Ajax等。

  • 伺服端網頁技術:
    伺服端網頁技術建立的程式不是在讀者電腦的瀏覽器執行,而是透過Internet連接的Web伺服器上電腦執行。對於網路爬蟲來說,伺服端使用哪種技術並不重要,只需找到目標資料所在網頁的URL網址和所需參數,就能取得爬取資料的網頁內容,即目標資料所在的網頁。常的用伺服端網頁技術有ASP、Python、Node.js等。

今天的分享就先到這邊,我們明天見~ /images/emoticon/emoticon41.gif

參考書籍資料:文科生也可以輕鬆學習網路爬蟲


上一篇
DAY22-爬取階層選單巡覽的網站
下一篇
DAY24-認識網頁設計技術與JavaScript(下)
系列文
30天網路爬蟲學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言