30天帶你從零基礎到Python爬蟲

霓霓 (chengni)

iT邦新手 3 級 ‧ 點數 752

27020

累計瀏覽數

94人

在追蹤

站內簡訊追蹤

鐵人檔案

2022 iThome 鐵人賽

回列表

AI & Data

30天帶你從零基礎到Python爬蟲系列

在這30天的期間內，我會手把手帶你從完全零基礎到可以利用Python來爬你想爬的資料，一定讓你學得明明白白，快來一起踏上爬蟲之旅！

鐵人鍊成｜共 30 篇文章｜ 34 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 2047 瀏覽

DAY 21

[Day21] 爬蟲必備工具 - BeautifulSoup

BeautifulSoup是一個用來解析HTML結構的Python函式庫，能夠輕鬆的從HTML或XML檔案中分析資料，因此在爬蟲應用中是很常見的。今天就來開發一...

2022-09-21 ‧ 由霓霓分享

0 Like 0 留言 2607 瀏覽

DAY 22

[Day22] 爬蟲實戰演練 - 美食網站抓資料

上一篇提到的是抓圖片資料，這一篇就比較單純是抓網址及文字，今天示範的網站是一個日本的美食評比網站--tabelog。今天我想要列印出商家英文名稱、日文名稱、菜...

2022-09-22 ‧ 由霓霓分享

1 Like 1 留言 2216 瀏覽

DAY 23

[Day23] 爬蟲實戰演練 - PTT表特版

今天要實作的是爬取PTT表特版上的圖片，會以這篇作為示範，那就開始吧！找到正確的網址按右鍵檢視原始碼可以清楚找到我需要的資料，可以直接拿網址列的網址，所以就...

2022-09-23 ‧ 由霓霓分享

0 Like 0 留言 1464 瀏覽

DAY 24

[Day24] 爬蟲實戰演練 - 奇摩電影

這一篇和前幾天的美食網站例題差不多，都是去抓網址及文字，今天要示範的網站是奇摩電影的本週新片。今天我想要列印出電影中文名稱、英文名稱、上映時間還有期待度。確...

2022-09-24 ‧ 由霓霓分享

0 Like 0 留言 1768 瀏覽

DAY 25

[Day25] Pandas基本使用

今天要介紹的是Python用來資料處理的一個工具--Pandas，可以讀取各種檔案轉成表格（csv, excel...）的格式，它也可以快速結合常用的繪圖函式庫...

2022-09-25 ‧ 由霓霓分享

0 Like 0 留言 1185 瀏覽

DAY 26

[Day26] Pandas實戰演練 - 政府開放資料

今天不是爬蟲的實戰，今天是要來使用Pandas套件，示範的檔案是來自政府資料開放平台裡就醫中的台灣COVID-19冠狀病毒檢測每日送驗數，可以直接下載CSV格式...

2022-09-26 ‧ 由霓霓分享

0 Like 0 留言 1122 瀏覽

DAY 27

[Day27] 爬蟲實戰演練 - 奇摩電影2.0

昨天的練習是抓取csv內的資料，那今天的練習是要把資料寫進表格內，就用[Day24] 爬蟲實戰演練 - 奇摩電影這個練習題吧～上次的完整程式碼這裡先附上上次...

2022-09-27 ‧ 由霓霓分享

1 Like 0 留言 2643 瀏覽

DAY 28

[Day28] 動態網頁爬蟲 - Selenium

不知道你有沒有發現，之前的爬蟲實作找到的資料都是只有第一頁的，不會抓到第二頁的資料，今天要介紹另一個爬蟲常用工具--Selenium，它是模擬一般人瀏覽網頁的所...

2022-09-28 ‧ 由霓霓分享

0 Like 0 留言 4494 瀏覽

DAY 29

[Day29] 爬蟲實戰演練 - iThome文章標題

今天也是要去爬目標網站的網址以及相關資訊，不過我最喜歡今天的這篇，因為我要爬自己的文章，爬有關自己的資料特別興奮ヽ(✿ﾟ▽ﾟ)ノ，今天示範的網站是我去年的鐵人賽...

2022-09-29 ‧ 由霓霓分享

0 Like 1 留言 1647 瀏覽

DAY 30

[Day30] 爬蟲實戰演練 - iThome文章標題2.0

還記得[Day29] 爬蟲實戰演練 - iThome文章標題抓下來的內容嗎？有沒有發現它只有我第一頁文章的標題，明明我就有超級多優質的文章（自己說），這是因為給...

2022-09-30 ‧ 由霓霓分享

霓霓的鐵人檔案

霓霓的收藏

霓霓的追蹤

霓霓的Like

霓霓的紀錄

霓霓的訂閱列表

鐵人檔案

30天帶你從零基礎到Python爬蟲 系列

標記使用者

30天帶你從零基礎到Python爬蟲系列