iT邦幫忙

2023 iThome 鐵人賽

DAY 16
0

https://ithelp.ithome.com.tw/upload/images/20230928/20151627jtQXXkVVs9.png

✿數據分析需要統計概念?為什麼?
基礎的統計學能夠提供分析、解釋數據的方法與技術,可幫助分析師預測趨勢與相關性。

以下是一些數據分析中常見的統計概念:

  • 變異數:變異性指的是數據集中各個數據點與數據集中心之間的差異。 變異性是一個關鍵概念,有助於我們理解數據的分佈和穩定性。

  • 質變數:也稱為分類變數,是用於描述專案類別或標籤的變數。 例如,性別(生理男、生理女)、產品類型(A、B、C)等都是分類變數。‎

  • 量變數:也稱為數值變數,是可以用數值表示和測量的變數。量變數可以是離散的或連續的。 量變數其中也分為離散變數與連續變數。
    -離散變數是有限的、分散的,通常是整數,如家庭成員數量。 連續變數可以具有無限數量的值,通常可以以更高的精度測量,如身高或溫度。‎
    -連續變數是取值在一定範圍內是連續的,可以是任何值,而不僅僅是整數。 例如,身高是連續數據。‎

  • 標準差:衡量數據集數據點在平均值周圍分散程度的指標。

  • 迴歸分析:一種統計方法,用於評估兩個或多個變數之間的關係,並預測一個變數如何受其他變數的影響。

  • 假設檢驗:用於評估兩個或多個群體之間是否存在統計上的差異的統計方法。

  • 正態分佈:一種常見的概率分佈,呈鐘形曲線,具有平均值和標準差。

  • 抽樣:從大型數據集中選擇部分數據進行分析的過程,以代表整體數據集。

  • 信賴區間:用於表示估計參數值的範圍,通常是平均值的信賴區間。

  • 相關性:評估兩個變數之間的關聯程度的統計方法。

基礎的統計概念在數據分析中非常重要,能夠幫助分析師理解數據、檢測模式、做出預測,這項統計概念的魔法,能夠從數據中找到有價值的數據資料,進而做出基於數據產出證據的決策,為企業帶來更多有利的價值。


上一篇
Day15.數據分析裡的事實資料
下一篇
Day17.當個資料探勘的寶藏獵人吧!(上篇)
系列文
企業戰情室:30天理解營運智慧分析師對企業施展的魔法30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言