機率與統計是資料科學的基石,每個資料科學家都應該具備此涵養。為了讓自己的資料科學職業生涯能蒸蒸日上,我將挑戰完讀一系列統計與機率的課程。當然,在鐵人賽的30天遠遠不足以達到我的目標,因此我的持續寫作將會持續的更久。而鐵人賽的30天我將要探討的主題為機率,等著入門資料科學的朋友們快一起跳上車吧,我不是老司機,但我希望我的學習過程能對你有所幫助!
這次的鐵人賽系列文,除了正在撰寫的[特徵工程in 30 days]以外,又給自己增加了一項連續30天的寫文挑戰,這次將是有關機率數學的主題。在參加鐵人賽的過程當...
機率模型 在本系列文章中將探討何謂機率模型。模型泛指通過抽象和簡化表現某事物的特徵。例如某動漫人物的樹指模型是對該動漫人物特徵的簡化表現(因為樹指模型只有該動漫...
屬性-1 If , then 此表達式中的意思,A為B的子集合,因此A發生之機率必小於等於B發生之機率。換句話說由於A被包含於B之中,所以B可以看成由兩個區塊...
使用假設檢驗進行特徵選擇假設檢驗是統計學中的一種方法,可以對單個特徵進行更複雜的統計檢驗。通過假設檢驗進行特徵選擇將嘗試僅選擇數據集中的最佳特徵,就像我們使用...