iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 8
0

著個湯不是用來喝的唷XDDDD
https://ithelp.ithome.com.tw/upload/images/20171214/201073980oNinsPEEX.jpg

是用來解構、擷取網頁資訊的拍森函式庫來著Www

開啟終端機輸入下面著4行指令,安裝先~~~

easy_install pip
pip install BeautifulSoup4
pip install lxml
pip install html5lib 

ps: 安裝需要管理權限,要記得酥肚(sudo)一下,弄到管理權限喔!


網頁爬爬規則:

  1. 爬爬前請祥閱網站的條款和條件,仔細閱讀數據合法使用聲明,確認合理的使用範圍。
  2. 不要DDoS網站,程序過於頻繁的向網站發出數據請求,可能會玩壞人家網站,著是不道德的行為。提醒自已…別不小心,當了不理貌的孩紙~~~
  3. 網站的佈局不會一成不變,時常重新訪問網站,修改叩,維護功能。

上一篇
[Day7]Python自習手札:Selenium腳本錄製與匯出
下一篇
[Day9]Python自習手札: beautifulsoup應用
系列文
打雜人生-腦容量不夠用就筆記筆記唄9
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言