Twitter官方提供了API,讓使用者可以快速地抓取到想要的資料,
本篇文章將會使用 python3 與 Twitter API 實作如何使用 Getsearch function 抓取資料。
首先,先到 https://developer.twitter.com/en/apply-for-access 申請API的通行密碼。
將4組密碼放入twitter.Api中。
term: 輸入要搜尋的關鍵
since: 搜尋的起始日期 (格式範例: 2020-01-01)
until: 搜尋的截止日期 (格式範例: 2020-01-02)
count: 資料筆數 (預設為15,最多可到100)
result_type: 資料傳回的類型 (分為mixed、recent、popular)
return_json: 輸出是否要為json格式 (True or False)
import twitter
api = twitter.Api(consumer_key='你的consumer_key',
consumer_secret='你的consumer_secret',
access_token_key='你的access_token_key',
access_token_secret='你的access_token_secret')
docs = api.GetSearch(term='台灣', since='2020-01-01', count=25, result_type='popular', return_json=True)
print(docs)
## 選取自己需要的資料
for i in docs['statuses']:
text = i['text']
user_name = i['user']['name']
url = 'https://twitter.com/{}/status/{}'.format(i['user']['screen_name'], i['id'])
GetUser() -- 搜尋作者資訊