續上一篇LLM 和機器學習的介紹-Part 1,我想更深入地介紹一些數據建模、LLM和機器學習的示例。
統計概念
大數據以及machine learning的基礎就是統計學。我想要探討一下其中的4種:
1. 傾向建模(Propensity modeling)
傾向建模是指不同類型的統計模型,用來研究行為是否影響未來的決定或動向。
通過了解這些接觸點和行為的綜合資訊,我們可以更深入了解用戶行為如何影響轉化,並設計實驗來測試和改進用戶體驗和產品性能。但需要注意在用此模型時,樣本數據要大以及多元在不會有偏誤。
參考資料:
https://www.expressanalytics.com/blog/propensity-modeling-to-predict-customer-behavior-using-machine-learning/
https://www.prooveintelligence.com/blog/an-introduction-to-propensity-modeling/
2. 假設檢驗 (Hypothesis testing)
假設檢驗用於使用樣本數據來評估假設的合理性。統計分析師通過測量和檢查被分析人口的隨機樣本來測試假設到底成立或不成立。
如果你想測驗假設到底可否有影響,就要實施假設檢驗。這樣你就可以比較你的研究結果之前和之後的影響。
例如,以下我們可以用用假設檢驗來測試:
實案例子:
參考資料:https://www.hotjar.com/ab-testing/examples/
對 dbt 或 data 有興趣?歡迎加入 dbt community 到 #local-taipei 找我們,也有實體 Meetup 請到 dbt Taipei Meetup 報名參加
Ref:
https://levelup.gitconnected.com/20-pandas-functions-for-80-of-your-data-science-tasks-b610c8bfe63c