iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 15
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 15

[DAY 15] 統計雜談: 午間斜陽-統計有甚麼用?

  • 分享至 

  • xImage
  •  

番外篇-
吃完飯後,飛哥躺在休息間的沙發上,望著窗外照進的陽光,開始回憶起當初接觸數學到現在活用統計的日子。

一開始接觸「數學」,除了對這個科目有相當的好感外,也是所有科目中不需要有過多臆測的科目。數學是所有科學的起點,對於理論、證明、邏輯而言,是非分明,非黑即白,因此對於飛哥這種注重邏輯思維的人來說,是在適合不過的科目了。

但是,在學習的過程遇到太多理論、太多證明沒有辦法活用在生活中,因此飛哥在學生時期就萌生了希望未來能將數學應用到生活上、應用到工作上的想法,也因為這樣開始接觸數學的其中一個分支,「統計」。統計在各個領域都用的到,而且能根據該領域的特徵來延伸出不同的統計方法,像是「傳產的良率分析」、「醫界的存活分析」、「流病界的時間序列」、「金融界的計量經濟」、「心理學界的結構方程模型」、......等等,此外,還有純學術的統計研究與大家耳熟能詳且到處都能看見其蹤跡的各種回歸模型,看到這樣一門學科活躍於各個領域,讓飛哥不禁把希望寄託在統計身上。

統計之所以能應用在各個領域,是因為其理論的廣用度高,雖然每個理論的背後還是有其嚴謹的假設存在,例如:資料可能要符合常態分佈、兩組的變異數可能要一樣等諸如此類的限制條件,但最重要的還是「確實了解該領域的背景知識(background knowledge)」,如果你只會理論,但不了解該產業的特性,往往業內認為的基礎知識,常常能成為阻礙你的絆腳石。飛哥回憶起這些年接觸過的資料,太多人為了讓模型貼近資料,而選擇結構複雜的模型,完全不考慮該領域知識背後的邏輯,可能「簡單的模型就符合資料特徵」,卻因為「資料界定不周或資料來源過少」,背棄了統計的初衷,這樣除了凸顯自身的不專業外,也難讓外人親近了解統計的好處。

飛哥看了下旁邊熟睡著的小博,繼續思考著。

到頭來學了那麼多數學,能活用的也就那幾種,最難的還是「看透資料的本質」,你看見的資料不一定是真的資料,這些數據怎麼產生的是有許多不同的邏輯,唯有抽絲剝繭後,將數據源頭到產出確實了解後,才能選擇適當的統計手法進行分析。

窗外的陽光依舊耀眼地炙熱,桌邊的熱茶緩緩地冒著甘香的蒸氣,統計雖然萬用,但用的不好,就像泡茶用了錯誤的手法,再好的品質依舊只是一灘混水。


上一篇
[DAY 14] 統計雜談: B董的午餐會 - P-value重要嗎?
下一篇
[DAY 16] 章節2-10: 通心丸的購買量-卜瓦松回歸(Pyhton)
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言