iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

Python 機器學習實驗室 ʘ ͜ʖ ʘ 系列

一起打開機器學習的窗戶,每天談論一點點模型介紹和Python資料分析相關例子

鐵人鍊成 | 共 30 篇文章 | 6 人訂閱 訂閱系列文 RSS系列文
DAY 11

分類模型哪個好?confusion matrix/sensitivity/ specificity

今天來整理一下以前的筆記,聊聊比較分類模型的評判依據:confusion matrix. 下圖是常見的confusion matrix的圖: 用個例子來解釋上圖...

2021-09-25 ‧ 由 nancysunnn 分享
DAY 12

分類模型哪個好?ROC/ AUC

從上篇的confusion matrix可以延生出不同的比例,從比例我們也可以在延伸出不同的曲線來比較模型。 ROC curve 我們都知道logistic m...

2021-09-26 ‧ 由 nancysunnn 分享
DAY 13

KNN VS. K-means

有一陣子常常把KNN和K-means搞混,今天來聊聊兩者的區別~ KNN(k-nearest neighbors) KNN是supervised算法,主要解決分...

2021-09-27 ‧ 由 nancysunnn 分享
DAY 14

如何避免Overfitting

Overfitting是在執行任何模型的時候我們都要注意的問題,今天就來聊聊overfitting是什麼 Overfitting vs. underfittin...

2021-09-28 ‧ 由 nancysunnn 分享
DAY 15

回歸模型的衡量標準:MSE. RMSE. MAE. MPE

在建立多個regression models後,我們常要選擇一個指標來衡量模型好壞,今天來聊聊各個不同的指標~ MSE(Mean Square Error) M...

2021-09-29 ‧ 由 nancysunnn 分享
DAY 16

[Python]文字識別模型-PaddleOCR

今天剛好找到一個有趣的文字識別模型,想來和大家介紹一下~ PaddleOCR PaddleOCR是百度研究出來的文字識別模型,主要可以把圖片當成input然後判...

2021-09-30 ‧ 由 nancysunnn 分享
DAY 17

p value到底怎麼解釋

在面試的時候很常都會從基礎的問題開始問起,p值就像是你吃飽了嗎一樣每次都會出現,今天就來講解一下這個人人都說“小於0.05就拒絕”的p值到底是什麼 假設檢定 p...

2021-10-01 ‧ 由 nancysunnn 分享
DAY 18

standardize VS normalize

當我們想要把資料丟進model前,常常會需要把資料標準化,尤其是針對跟距離有關的模型(像是knn, svm等),標準化大概分為standardize和norma...

2021-10-02 ‧ 由 nancysunnn 分享
DAY 19

Cross validation是哪位?

cross validation是我們在建模時常常要使用的方法,主要的功能是避免overfitting的問題, 也是我們調參數後可以互相評估比較的手法,今天來聊...

2021-10-03 ‧ 由 nancysunnn 分享
DAY 20

vectorize VS label encoded

很多模型只能夠處理數字,所以當我們有類別變數的時候需要先轉換成數字,而轉換的方法有兩種,針對類別變數我們有兩種方法可以處理: label encoding:...

2021-10-04 ‧ 由 nancysunnn 分享