iT邦幫忙

鐵人檔案

2018 iT 邦幫忙鐵人賽
回列表
自我挑戰組

30天Python學習分享路程 系列

簡單介紹Python學習歷程,用30天學習Pytoh,可能會介紹到如何用Python爬蟲

鐵人鍊成 | 共 30 篇文章 | 99 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11-寫爬蟲程式前你必須知道的些事情

什麼是HTML HTML(HyperText Markup Language),他是個用於網頁上的標示語言結構如下 <!DOCTYPE html>...

DAY 12

什麼是HTTP協定?

前言 雖然我得目的是要學習Python但是就像說你要寫一個影像辨識軟體,但是你不懂電腦是如何處理影像的你只是會用別人的API而已,要寫網路爬蟲你也必須要清楚網路...

DAY 13

Python-使用Request向Server端請求資源

大家2018新年快樂啊今天也是個很懶得一天單純介紹個Request模組,只有簡單我們之後會使用的方法其餘與Python程式相關的組合在日後的實例會放在一起解說...

DAY 14

Day14-使用BeautifulSoup解析原始碼

這一篇我會介紹一下如何解析從Requests,得到的Html原始碼,利用BeautifulSoup將原始碼轉換成DOM-Tree的結構,使用BeautifulS...

DAY 15

Day 15-BeautifulSoup(下)

先補這一篇的債 如果當你發現BeautfisulSoup解析出來的數據為亂碼時,先檢查requests的內容是否也是亂碼具體作法我們來測試一個網址從中央氣象局取...

DAY 16

Python-檔案處理篇(上)

如何在程式做檔案的讀寫呢? 如果只是基本的文字檔並不需要引用模組,但是如果檔案要使用資料表 ex:csv 類型的檔案的話就必須要引用模組了 先介紹基本的File...

DAY 17

Python -檔案處理篇(下)

CSV模組介紹 為何要介紹CSV模組,我們要將爬蟲爬到的資料做儲存,有兩種方式1.將資料存到資料庫(建議使用NOSQL)2.將資料存到CSV檔因為爬回來的資料型...

DAY 18

Python Selenium模組介紹 (一)

補了一Day15的了目前先做今天的再補檔案篇= = 前言 看來Python系列中間有遇到些問題,在處理上沒那麼順利,再加上一次做兩個系列心得真的累...對不起各...

DAY 19

Python Selenium模組介紹 (二)

讓我的電腦跑一下 測試一下 再將心得貼上來 電腦太舊跑不太動爬蟲 如果遇到按鈕是用來轉跳頁,要進到下一頁可以先用瀏覽器工具找出下一頁的按鈕有無存在,再抓取XPA...

DAY 20

Python 例外處理

前言 這邊進度有點落後...好久沒有更新了,主要還是把重心放在了我另外一篇文章上了,而Python部份由於都在撰寫程式並沒有比較多的時間把東西整理上來,這邊也只...