"多變量統計分析(Multivariate Statistical Analysis),又稱多元統計分析,簡稱多變量分析,為統計學的一支,常用於管理科學、社會科學和生命科學等領域中。多變量分析主要用於分析擁有多個變數的資料,探討資料彼此之間的關聯性或是釐清資料的結構,而有別於傳統統計方法所著重的參數估計以及假設檢定。由於多變量分析方法需要複雜且大量的計算,因此多藉助電腦來進行運算,常用的統計套裝軟體有SAS、SPSS、Statistica等。"
上面那段話是我難得 Copy & Paste 自 Wiki 的定義, 其中有幾個關鍵字: "多個變數", "關聯性", "資料結構", "複雜且大量的計算", 就直接看這幾個字就是修讀原因了.
當然要學這科目之前一定要有微積分與統計的基礎, 但若這些基礎科目都寫了可能 28 堂課也寫不完.
多變量要學的東西很多主要可以分成:
只是這樣說大家還是不知道說甚麼, 若是說下面常用到的技巧是屬於多變量分析的, 大家就會恍然大悟了:
在許多 Data Mining 中常用到的分類, 分群, 跟因子判別都是從這邊出來的, 我想就應該大家都了解了.
在一本多元統計分析的介紹中, 說這是可以應用在: "計量經濟研究、經濟管理、計劃、統計、人口分析、地質、地震、生態、環境、農業、林業研究、醫藥研究、新藥設計" 等等, 就可以知道這是多重要的一科.
當然統計與數學跟資料有關的還不只如此, 甚至之後會提到的都會跟這有關, 包含 ANOVA, 以及時間序列, 只是就放在另外一堂課了.
建議線上課程:
建議電子書:
延伸關鍵字: