iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
AI & Data

30天帶你從零基礎到Python爬蟲 系列

在這30天的期間內,我會手把手帶你從完全零基礎到可以利用Python來爬你想爬的資料,一定讓你學得明明白白,快來一起踏上爬蟲之旅!

鐵人鍊成 | 共 30 篇文章 | 35 人訂閱 訂閱系列文 RSS系列文
DAY 21

[Day21] 爬蟲必備工具 - BeautifulSoup

BeautifulSoup是一個用來解析HTML結構的Python函式庫,能夠輕鬆的從HTML或XML檔案中分析資料,因此在爬蟲應用中是很常見的。今天就來開發一...

2022-09-21 ‧ 由 霓霓 分享
DAY 22

[Day22] 爬蟲實戰演練 - 美食網站抓資料

上一篇提到的是抓圖片資料,這一篇就比較單純是抓網址及文字,今天示範的網站是一個日本的美食評比網站--tabelog。 今天我想要列印出商家英文名稱、日文名稱、菜...

2022-09-22 ‧ 由 霓霓 分享
DAY 23

[Day23] 爬蟲實戰演練 - PTT表特版

今天要實作的是爬取PTT表特版上的圖片,會以這篇作為示範,那就開始吧! 找到正確的網址 按右鍵檢視原始碼可以清楚找到我需要的資料,可以直接拿網址列的網址,所以就...

2022-09-23 ‧ 由 霓霓 分享
DAY 24

[Day24] 爬蟲實戰演練 - 奇摩電影

這一篇和前幾天的美食網站例題差不多,都是去抓網址及文字,今天要示範的網站是奇摩電影的本週新片。 今天我想要列印出電影中文名稱、英文名稱、上映時間還有期待度。 確...

2022-09-24 ‧ 由 霓霓 分享
DAY 25

[Day25] Pandas基本使用

今天要介紹的是Python用來資料處理的一個工具--Pandas,可以讀取各種檔案轉成表格(csv, excel...)的格式,它也可以快速結合常用的繪圖函式庫...

2022-09-25 ‧ 由 霓霓 分享
DAY 26

[Day26] Pandas實戰演練 - 政府開放資料

今天不是爬蟲的實戰,今天是要來使用Pandas套件,示範的檔案是來自政府資料開放平台裡就醫中的台灣COVID-19冠狀病毒檢測每日送驗數,可以直接下載CSV格式...

2022-09-26 ‧ 由 霓霓 分享
DAY 27

[Day27] 爬蟲實戰演練 - 奇摩電影2.0

昨天的練習是抓取csv內的資料,那今天的練習是要把資料寫進表格內,就用[Day24] 爬蟲實戰演練 - 奇摩電影這個練習題吧~ 上次的完整程式碼 這裡先附上上次...

2022-09-27 ‧ 由 霓霓 分享
DAY 28

[Day28] 動態網頁爬蟲 - Selenium

不知道你有沒有發現,之前的爬蟲實作找到的資料都是只有第一頁的,不會抓到第二頁的資料,今天要介紹另一個爬蟲常用工具--Selenium,它是模擬一般人瀏覽網頁的所...

2022-09-28 ‧ 由 霓霓 分享
DAY 29

[Day29] 爬蟲實戰演練 - iThome文章標題

今天也是要去爬目標網站的網址以及相關資訊,不過我最喜歡今天的這篇,因為我要爬自己的文章,爬有關自己的資料特別興奮ヽ(✿゚▽゚)ノ,今天示範的網站是我去年的鐵人賽...

2022-09-29 ‧ 由 霓霓 分享
DAY 30

[Day30] 爬蟲實戰演練 - iThome文章標題2.0

還記得[Day29] 爬蟲實戰演練 - iThome文章標題抓下來的內容嗎?有沒有發現它只有我第一頁文章的標題,明明我就有超級多優質的文章(自己說),這是因為給...

2022-09-30 ‧ 由 霓霓 分享