iT邦幫忙

DAY 9
0

成為資料工程師最初的 28 堂課系列 第 9

資料工程師第 8/28 課: 多變量分析

[修讀原因]

"多變量統計分析(_Multivariate Statistical Analysis_),又稱多元統計分析,簡稱多變量分析,為統計學的一支,常用於管理科學社會科學生命科學等領域中。多變量分析主要用於分析擁有多個變數的資料,探討資料彼此之間的關聯性或是釐清資料的結構,而有別於傳統統計方法所著重的參數估計以及假設檢定。由於多變量分析方法需要複雜且大量的計算,因此多藉助電腦來進行運算,常用的統計套裝軟體有SASSPSSStatistica等。"

上面那段話是我難得 Copy & Paste 自 Wiki 的定義, 其中有幾個關鍵字: "多個變數", "關聯性", "資料結構", "複雜且大量的計算", 就直接看這幾個字就是修讀原因了.

當然要學這科目之前一定要有微積分與統計的基礎, 但若這些基礎科目都寫了可能 28 堂課也寫不完.

[基本資訊]

[基本介紹]

多變量要學的東西很多主要可以分成:

  • 變異數分析
  • 共變數分析
  • 主成份分析
  • 因素分析
  • 典型相關分析
  • 信度與效度
  • 集群分析 (聚類分析)
  • 區別分析

只是這樣說大家還是不知道說甚麼, 若是說下面常用到的技巧是屬於多變量分析的, 大家就會恍然大悟了:

  • 多元迴歸 (Multiple Regression)
  • 路逕分析 (Path Analysis)
  • 探索性資料分析
  • 模式識別
  • 馬爾科夫概型分析

在許多 Data Mining 中常用到的分類, 分群, 跟因子判別都是從這邊出來的, 我想就應該大家都了解了.

在一本多元統計分析的介紹中, 說這是可以應用在: "計量經濟研究、經濟管理、計劃、統計、人口分析、地質、地震、生態、環境、農業、林業研究、醫藥研究、新藥設計" 等等, 就可以知道這是多重要的一科.

當然統計與數學跟資料有關的還不只如此, 甚至之後會提到的都會跟這有關, 包含 ANOVA, 以及時間序列, 只是就放在另外一堂課了.

[修習方式]

建議線上課程:

建議電子書:

延伸關鍵字:

  • 多元線性回歸
  • 多元逐步回歸
  • 嶺回歸
  • 系統聚類分析
  • 動態聚類分析
  • 模糊聚類分析
  • 多組判別分析
  • 逐步判別分析

上一篇
資料工程師第 7/28 課: 計算機結構/組織
下一篇
資料工程師第 9/28 課: 軟體工程
系列文
成為資料工程師最初的 28 堂課30

尚未有邦友留言

立即登入留言