[Day20] Scrapy爬蟲框架2_建立專案 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2022 iThome 鐵人賽

DAY 20

0

自我挑戰組

用Python學習網路爬蟲30天系列第 20 篇

[Day20] Scrapy爬蟲框架2_建立專案

14th鐵人賽

2022-10-04 21:37:12

955 瀏覽

分享至

建立Scrapy專案

了解Scrapy Shell的使用與測試擷取所需資料的操作後，實作練習以擷取批批踢股票看板的發文標題、推文數和作者資料為例，建立Scrapy的爬蟲專案。

實作練習

開啟Anacaonda Prompt命令提示字元，選擇建立專案的目錄
```
cd ..    #返回上一層目錄
cd       #到指定的目錄路徑
```
新增專案
```
scrapy startproject 專案名稱
```
使用cd指令切換到專案目錄，再使用下方指令新增Python爬蟲程式
```
scrapy genspider 檔案名稱 爬取網域
```
完成後可以看到Spyder內新增的爬蟲程式pttstock.py
在parse()函數下定位與擷取所需的資料
執行程式
```
scrapy scrawl 檔案名稱
```

[Day19] Scrapy爬蟲框架

[Day21] Scrapy爬蟲框架3_Item和Item Pipeline

系列文

用Python學習網路爬蟲30天共 30 篇

目錄

RSS系列文訂閱系列文

6 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙