找關鍵數據源,通常來自:
這個過程要記得清理數據,因為重複值和異常值會扭曲分析結果,也要填補缺漏的數據,修正錯誤的格式。
這跟第一天提到的概述內容有關,資料分析大致分為這四個類別:
/1. 描述分析Descriptive analysis:What happened?/
確定已發生的事實,讓數據已有意義的方式呈現,打好基礎。
/2. 診斷分析Diagnostic analysis:what did it happened?/
找到過去類似的模式,把可能導致此結果的因素建立相關性。
/3. 預測分析Predictive analysis:What will happen?/
找規律,預測未來可能的趨勢、潛在問題。
/4. 處方式分析Prescriptive analysis:How can we make it happen?/
為了達到希望的結果,我們可以做什麼?
通過驗證可以確定結論是否可靠,並且評估我們的模型或方法的性能。驗證方法包括:
將分析結果解釋成易於理解的形式,例如報告、圖表、可視化等。有效的溝通,可以確保分析結果不僅僅被理解,可以被用來支持業務決策和行動。