各位早安,書接上回我們簡單介紹過 html 基本架構了,從今天開始要正式開始實作爬蟲程式的部分,那實作的第一步就是搞定我們接下來會用到的 python 套件
套件基本上就是別人已經寫好複雜的功能需求供我們下載下來使用其中的功能
我們實作上會用到
1.pip
2.Requests
3.Beautifulsoup4
python pip 套件是 python 內建的套件管理工具
在你當初下載 python 的時候就已經一起安裝好了
我們今天其他的套件安裝都要靠它
是一個用來對網路伺服器發出請求的工具
可以實現
1.GET 取得
2.POST 新增-> 輸入密碼之類的
3.PUT 覆蓋
4.PATCH 更新部分
5.DELETE 刪除
等功能
是一個用來幫助我們解析複雜的 html 網頁內容並從中提取我們需要資訊的工具
我們今天要用到 cmd (命令提示字元)
開啟方法為 win10 其他作業系統請自行查詢 (應該很好查到)
首先按下 win+R 就會看到這個視窗
在標記位置打上 cmd
接著就會跳出 cmd 了
接著就要在這裡打指令來安裝套件
在 cmd 打上以下指令(建議複製貼上)
pip install requests
這個指令是叫 pip 下載並安裝 Requests 套件
就像紅色畫線部分那樣 按下 Enter
看到跑完有出現藍色畫線部分就表示成功了
其實我們也可以在 VSCode 的終端安裝
終端其實跟 cmd 功能一樣只是被限制範圍
在終端打上以下指令(建議複製貼上)
pip install Beautifulsoup4
這個指令是叫 pip 下載並安裝 Beautifulsoup4 套件
像這樣
按下 Enter
如果出現底下黃字代表還沒成功 沒出現就成功了
底下黃字是在說 pip 有新版本喔 快去安裝
所以要怎麼安裝呢
麻煩複製這段 (請務必一字不差)
然後貼在下面
相對位置
按下 Enter
最後跑完長這樣 有紅字畫線處 就成功了
你的 pip 版本號可能跟我不同很正常
關於玻璃是固體還是液體目前仍有爭議喔
你覺得玻璃是固體還是液體呢