Python 機器學習實驗室 ʘ ͜ʖ ʘ

nancysunnn (nancysunnn)

iT邦見習生 ‧ 點數 142

10125

累計瀏覽數

3人

在追蹤

站內簡訊追蹤

鐵人檔案

2021 iThome 鐵人賽

回列表

AI & Data

Python 機器學習實驗室 ʘ ͜ʖ ʘ 系列

一起打開機器學習的窗戶，每天談論一點點模型介紹和Python資料分析相關例子

鐵人鍊成｜共 30 篇文章｜ 6 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 8183 瀏覽

DAY 11

分類模型哪個好？confusion matrix/sensitivity/ specificity

今天來整理一下以前的筆記，聊聊比較分類模型的評判依據：confusion matrix. 下圖是常見的confusion matrix的圖：用個例子來解釋上圖...

2021-09-25 ‧ 由 nancysunnn 分享

0 Like 0 留言 3904 瀏覽

DAY 12

分類模型哪個好？ROC/ AUC

從上篇的confusion matrix可以延生出不同的比例，從比例我們也可以在延伸出不同的曲線來比較模型。 ROC curve 我們都知道logistic m...

2021-09-26 ‧ 由 nancysunnn 分享

0 Like 0 留言 3295 瀏覽

DAY 13

KNN VS. K-means

有一陣子常常把KNN和K-means搞混，今天來聊聊兩者的區別～ KNN（k-nearest neighbors） KNN是supervised算法，主要解決分...

2021-09-27 ‧ 由 nancysunnn 分享

0 Like 0 留言 2050 瀏覽

DAY 14

如何避免Overfitting

Overfitting是在執行任何模型的時候我們都要注意的問題，今天就來聊聊overfitting是什麼 Overfitting vs. underfittin...

2021-09-28 ‧ 由 nancysunnn 分享

0 Like 0 留言 48543 瀏覽

DAY 15

回歸模型的衡量標準：MSE. RMSE. MAE. MPE

在建立多個regression models後，我們常要選擇一個指標來衡量模型好壞，今天來聊聊各個不同的指標～ MSE（Mean Square Error） M...

2021-09-29 ‧ 由 nancysunnn 分享

0 Like 1 留言 24499 瀏覽

DAY 16

[Python]文字識別模型-PaddleOCR

今天剛好找到一個有趣的文字識別模型，想來和大家介紹一下～ PaddleOCR PaddleOCR是百度研究出來的文字識別模型，主要可以把圖片當成input然後判...

2021-09-30 ‧ 由 nancysunnn 分享

0 Like 0 留言 14338 瀏覽

DAY 17

p value到底怎麼解釋

在面試的時候很常都會從基礎的問題開始問起，p值就像是你吃飽了嗎一樣每次都會出現，今天就來講解一下這個人人都說“小於0.05就拒絕”的p值到底是什麼假設檢定 p...

2021-10-01 ‧ 由 nancysunnn 分享

0 Like 0 留言 8470 瀏覽

DAY 18

standardize VS normalize

當我們想要把資料丟進model前，常常會需要把資料標準化，尤其是針對跟距離有關的模型（像是knn, svm等），標準化大概分為standardize和norma...

2021-10-02 ‧ 由 nancysunnn 分享

0 Like 0 留言 3713 瀏覽

DAY 19

Cross validation是哪位？

cross validation是我們在建模時常常要使用的方法，主要的功能是避免overfitting的問題，也是我們調參數後可以互相評估比較的手法，今天來聊...

2021-10-03 ‧ 由 nancysunnn 分享

0 Like 0 留言 1693 瀏覽

DAY 20

vectorize VS label encoded

很多模型只能夠處理數字，所以當我們有類別變數的時候需要先轉換成數字，而轉換的方法有兩種，針對類別變數我們有兩種方法可以處理： label encoding:...

2021-10-04 ‧ 由 nancysunnn 分享

nancysunnn的鐵人檔案

nancysunnn的收藏

nancysunnn的追蹤

nancysunnn的Like

nancysunnn的紀錄

nancysunnn的訂閱列表

鐵人檔案

Python 機器學習實驗室 ʘ ͜ʖ ʘ 系列

標記使用者