「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 Google 和 AWS 辦過幾場演講,緩下腳步的同時找了份跨領域工作。偶而慢跑、愛跟小動物玩耍。曾立過很多志,最近是希望當一個有細節的人。」
字幕在 Youtube 中扮演了重要的角色,一部影片若為嘗試打入國際市場,字幕的上稿基本上不可少的,有個好的字幕能夠吸引更多人了解你的影片內容,這篇是 Python - 數位行銷的 Youtube 分析教學系列文章的第 9 篇,也是我參加 2021 iThome 鐵人賽中系列文章的第 9 天。
字幕功能被稱為 Captions,這表示著若有要抓取與 YouTube 字幕相關的內容都可以從這邊開始。 一般來說,Captions.list 支持以下字幕資源方法:
使用 youtube.captions().list() 的方式來抓取 VideoID 的字幕,這邊以 2021 年的蘋果秋季發表會 "Apple Event — September 14" 來測試,我們先從網址列的部分來知道這部影片的 VideoID 為何
def youtube_search():
request = youtube.captions().list(
part= "snippet",
videoId= "EvGOlAkLSLw"
)
response = request.execute()
print(response,"\n")
if **name** == '**main**':
youtube_search()
根據頻道創作者的習慣,許多頻道創作者會將字幕嵌到原影片內,也就是在影片輸出時就已經剪入字幕了,這樣的情況下就不會抓到 Youtube 的字幕設定囉。要判斷有一個方法就是影片右下角的符號中,是否有 CC (Captions) 的圖示,如果沒有代表這部影片的文字是內嵌原影片。這邊以電賴少女的 "iPhone 13 系列值不值得買?誰適合買哪支?舊機降價現在入手是否更超值?一次幫你解答" 影片作為範例
今天說明了字幕資訊抓取的方法,也補充一下字幕相關的 API 資訊,以及其所需要花費的 Quota 數:
謝謝你的閱讀,如果有時間也歡迎看看我的夥伴們的文章:
lu23770127 — SASS 基礎初學三十天
10u1 — 糟了!是世界奇觀!
juck30808 — Python — 數位行銷分析與 Youtube API 教學
HLD — 淺談物件導向與Design Pattern介紹
SiQing47 — 前端?後端?你早晚都要全端的,何不從現在開始?
【鮭魚均】 現職是 200 多萬訂閱 Youtuber 的數據分析師,專長在 Python 的開發與使用,大學雖然是資訊背景但總是斜槓跑到商管行銷領域,以工作角度來說的話,待過 FMCG、通訊軟體、社群影音產業,也算是個數位行銷體系出生的資訊人。這 30 天鐵人挑戰賽會從數位行銷角度去重新切入數據分析這件事情,期待這個資本主義的社會中,每個人能在各個角力間不斷沖突而漸能找到一個平衡點回歸最初的統計建立最終的初心。
下一篇:Youtube Data API 教學 - 看透你的頻道你的心 channels.list