iT邦幫忙

2021 iThome 鐵人賽

DAY 13
2

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 Google 和 AWS 辦過幾場演講,緩下腳步的同時找了份跨領域工作。偶而慢跑、愛跟小動物玩耍。曾立過很多志,最近是希望當一個有細節的人。」


Youtube Data API 教學 - 告一個段落

Youtube Data API 的教學跟使用在現階段告一段落,最主要和最常使用的功能都已經藉著前幾天的機會講解完了,接下來我們會進入 Youtube Analytics API 的世界,在這之前我想用一點簡單的介紹座橋樑做一點吸收,這篇是 Python - 數位行銷的 Youtube 分析教學系列文章的第 13 篇,也是我參加 2021 iThome 鐵人賽中系列文章的第 13 天,大家也可以趁著這個機會點選下方的系列文章回顧,來看看 Day1 - Day12 的所有內容。

系列文章:Python — 數位行銷分析與 Youtube API 教學
昨日回顧:Youtube Data API 教學 - 那就從播放清單 playlistItems.list

關於 Data API 帶給我們的一些改變

數位媒體平台的經營是現階段的趨勢,也是許多人做廣告導流與社群經營的標的,顧問業、品牌端、媒體業、金融業,數位媒體就像是各個產業的交集,甚至打破的人與品牌間的界線與框架,讓品牌能夠與用戶跟加拉近距離,各家產業已經從傳統行銷方式轉型至社群媒體的經營 (Facebook、Instagram、Youtube、Tiktok) 也包含了品牌經營策略與廣告投放策略,數位行銷與生活已經密不可分且息息相關。這 30 天鐵人挑戰賽會從數位行銷看數字的角度去重新切入數據分析這件事情,除了 Python 教學的程式開發外,我也想一點一滴地回歸最初的試算表和基本統計帶領大家進入Youtube 的數位行銷世界。比起一口氣寫 Code 我更期待沒有經驗的小白穩扎穩打的實用在工作上,這門課除了本身的 API 應用外,我們日常工作上也會有一些工具做使用。

第 1 項實用工具 - 試算表 Microsoft Excel ( 包含 Google Sheets)

這是大家最普遍所使用到卻也最容易被遺忘的工具,高效率與方便性讓其立足於不敗的地位,作為數據分析師 80% 的時間幾乎都會需要跟 Excel 繞著打轉,Excel 用到精通可以說是最基本的條件,所以回歸到最入門,我們一切都從 Excel 開始講起,基本的統計條件、統計公式與概念、各式不同的 Function 使用,稍微進階的 Vlookup- Hlookup- 樞紐分析,到最後進階的會聊聊 Scenario Manager、Solver 計算最大獲利(經濟曲線)、Goal Seek 的使用。

要注意的是,無論是 Microsoft Excel 或是 Google Sheet 對於超過百萬筆的資料量都是龐大的負擔,可能導致運算速度變得非常慢,根據 Microsoft 官方的規格及限制,Excel 工作表上的總列數和欄數上限為1,048,576 列乘以 16,384 欄,根據 Google Support 官方的規格限制,Google Sheet 最多只能包含 500 萬個儲存格或 18,278 個欄 (欄 ZZZ),這也是為什麼在大量數據分析的情形下,我們可能會傾向使用 Python。

Sheet

第 2 項實用工具 - 大數據分析處理 Python (包含 R 語言)

相較於 Excel 的在資料處理的方便性,Python 更適合用於大量數據的處理, 超過百萬筆或是千萬筆的資料我們更傾向使用 Python 或是 R 進行數據的處理和分析,同時搭配 Python 語言有許多方便的 Package,像是 Pandas、Numpy、Matplotlib 等等的,能夠幫助我們更容易處理大量數據的應用

同時, Python 對於其他語言的支持度也非常的強,所以像是資料庫儲存的支援性 DB, MySQL, MsSQL, 也會非常的好,能夠在 Python 上直接進行跨語言的執行與資料抓取,甚至後期我們會談到如何把資料 update 到網頁端,讓數據查詢可以從自己的電腦躍升到網頁執行面上。

Python

第 3 項實用工具 - 機器學習與人工智慧

在更多的情況下,有些許的資料我們可能沒有辦法用現有的資料進行運算與預測,舉例來說我現在手上有一張圖,你可以說說這是什麼嗎?

WriteSome

在過去 Rule-Based model 的情況下,我們會藉由方法去定義這一項物品的特徵,舉例來說上面這張圖,我可以認為它具有以下的特徵性質

  • (1)他具有琴身
  • (2)上長下寬的特性
  • (3)中間疑似有個圓孔
  • (4)上方有長鈕
  • (5)旁邊具有一個配件

綜合了以上幾個特徵,我會定義他為一個物品,可能是吉他,這是我們過去在程式開發 Rule-Based model 情形下可能的做法。但是對於機器學習來說,機器學習更偏向你給予了一些輸入資料,而機器能夠透過資料和經驗中學習,並且能夠找到其中的運行規則,最後達到人工智慧的一種方法目的。如同機器學習權威 Stanford 大學的 Andrew Ng 吳恩達教授所定義,「機器學習是一門讓計算機在沒有明確的程式設計情況下能夠採取行動的科學」,我們平常所繪畫的圖片,可能沒有辦法很明確的定義說什麼樣的圖片叫做吉他,但是當你給予機器學習大量的圖片時,他可以從中找尋規則了解他們的共同特徵,這就是所謂的機器學習

QuickDraw

機器學習與類神經網路除了繪圖辨識與物體辨識外,常見使用案例也包含了﹔語音識別、聲波探測、自然語言處理、語意分析、風格藝術、人臉辨識等等的。在過去的十年裡,機器學習為我們提供了自動駕駛汽車、實用的語音識別、有效的網絡搜索,以及對人類基因組的巨大改進。今天機器學習如此普遍,你可能每天都會使用它卻不自知,這項技術既低調卻又是讓人類邁向新生活水平的最佳途徑之一。

今天用比較輕鬆的方式做結束

如果有時間也歡迎看看我的夥伴們的文章:
lu23770127 — SASS 基礎初學三十天
10u1 — 糟了!是世界奇觀!
juck30808 — Python — 數位行銷分析與 Youtube API 教學
HLD — 淺談物件導向與Design Pattern介紹
SiQing47 — 前端?後端?你早晚都要全端的,何不從現在開始?

Jerry Chien

【鮭魚均】 現職是 200 多萬訂閱 Youtuber 的數據分析師,專長在 Python 的開發與使用,大學雖然是資訊背景但總是斜槓跑到商管行銷領域,以工作角度來說的話,待過 FMCG、通訊軟體、社群影音產業,也算是個數位行銷體系出生的資訊人。這 30 天鐵人挑戰賽會從數位行銷角度去重新切入數據分析這件事情,期待這個資本主義的社會中,每個人能在各個角力間不斷沖突而漸能找到一個平衡點回歸最初的統計建立最終的初心。

下一篇:小知識 - Google Sheets 與 Excel 世仇之戰


上一篇
Youtube Data API 教學 - 那就從播放清單 playlistItems.list
下一篇
小知識 - Google Sheets 與 Excel 世仇之戰
系列文
Python - 數位行銷分析與 Youtube API 教學30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 則留言

0
juck30808
iT邦研究生 1 級 ‧ 2021-10-14 11:22:38

--- 10/14完賽前重新更新錯字與圖片 ---

我要留言

立即登入留言