iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 30
1
Data Technology

使用Python進行資料分析系列 第 30

[Day30]完結篇:模組儲存&總結!

  • 分享至 

  • xImage
  •  

今天終於到了最後一天了,我們之前提過機器學習的演算法,現在我們要說明如何將訓練的model儲存起來,這樣下次要使用時就可以不需要再再重新訓練一次:

程式碼

要將模組儲存,可以使用sklearn中的joblib

from sklearn import svm
from sklearn import datasets
from sklearn.externals import joblib

接下來先建立資料集以及預測模型clf

clf = svm.SVC()
iris = datasets.load_iris()
X,y = iris.data , iris.target
clf.fit(X,y)

要將model儲存只要使用joblib.dump()就可以了:

joblib.dump(clf,'clf.pkl')

前面的clf為我們上面的svm.SVC(),後面的clf.pkl為檔名,這裡我們就稱為clf.pkl
執行完這段程式碼可以在目錄內看到新增了一個clf.pkl的檔案,現在我們來呼叫它:

clf2 = joblib.load('clf.pkl')

我們就可以直接使用它來做預測了,像這樣:

print(clf2.predict(X[0:1]))

得到結果[0],也就是我們的第一種花。


回顧

好了,今天終於走完30天了,首先先感謝自己的努力才能撐過期末考大爆炸,接著要感謝我的團隊隊員們互相打氣?
現在我們就來看看我們這30天做了什麼吧:

環境的安裝與操作

所謂工欲善其事必先利其器,一定要先將裝備都準備好:

[Day01]Anaconda環境安裝!
[Day02]Jupyter Notebook操作介紹!

python基本

環境已經好了,當然就是練練基本功:

[Day03]Python的基本運算!(上)
[Day04]Python的基本運算!(下)

資料分析的第一步

要使用python做資料分析,一定不能不知道三個重要的程式庫:

Pandas

pandas來整理資料吧!

[Day06]Pandas的兩種資料類型!
[Day07]Pandas操作資料的函數!
[Day08]Pandas資料的取得與篩選!
[Day09]Pandas索引的運用!
[Day10]Pandas Groupby使用!
[Day11]Pandas使用多層索引!
[Day12]Pandas處理字串資料!(上)
[Day13]Pandas處理字串資料!(下)
[Day21]Pandas就能輕易將資料視覺化!

Numpy

numpy做資料運算吧!

[Day14]Numpy的ndarray!
[Day15]Numpy操作索引&局部資料!
[Day16]Numpy的廣播&方法!
[Day18]Numpy檔案輸入與輸出!

Matplotlib

老闆看不懂這些資料啦,直接視覺化給他看!

[Day19]Matplotlib讓資料視覺化!
[Day20]Matplotlib資料視覺化進階!

Bokeh

不喜歡Matplotlib,可以用看看更厲害更簡單的Bokeh
[Day22]Bokeh更簡單的資料視覺化!

抓取資料

沒資料怎麼半?用Beautiful Soup吧!
[Day23]Beautiful Soup網頁解析!

機器學習

會了資料整理與運算還有視覺化後,我們就可以踏入機器學習這個領域了!

[Day24]什麼是機器學習Machine Learning?
[Day25]機器學習:特徵與標籤!
[Day26]機器學習:KNN分類演算法!
[Day27]機器學習:建立線性迴歸資料與預測!
[Day28]機器學習:特徵標準化!
[Day29]機器學習:交叉驗證!

心得

第一次參加鐵人賽,除了很開心能分享自己所會的,默默的寫技術文章以外,發現自己能夠挑戰完成30天的比賽真的是非常無敵的感動(落淚),而且中間還卡了一個超煩的期末考啊。
所以接下來我也開始挑戰自己的極限!(登冷)也就是不喝飲料30天,除了鍊成鐵人以外還可以身體健康一點點點。

非常感謝大家的訂閱文章給予支持。在此下台一鞠躬!


上一篇
[Day29]機器學習:交叉驗證!
系列文
使用Python進行資料分析30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

1
YY
iT邦見習生 ‧ 2018-03-19 02:14:35

全部看完了~
謝謝大大的入門教學
覺得Pandas那段看了很有收穫:))

看更多先前的回應...收起先前的回應...
plusone iT邦新手 5 級 ‧ 2018-03-19 12:08:55 檢舉

好用心竟然全部看完了!
謝謝你的喜歡與反饋~~~~

oooopppp1 iT邦新手 5 級 ‧ 2018-07-26 04:58:50 檢舉

感恩唷~棒棒!

donaldc iT邦新手 5 級 ‧ 2019-01-05 22:39:06 檢舉

全部看完了
寫得很棒,希望有更多作品造福大家

plusone iT邦新手 5 級 ‧ 2019-01-07 11:06:24 檢舉

真的感謝各位的支持(鞠躬)我會繼續努力的!
也謝謝各位都有看完還幫我找出錯誤,
太多沒有注意到的小錯誤了不好意思 XD

DiuDiu iT邦新手 5 級 ‧ 2022-11-05 21:49:55 檢舉

不好意思請問一下,如果直接呼叫pkl,辨識出來的結果有些奇怪,想看一下標籤的話應該怎麼做?
不知道為什麼有時候可以有結果,有時候出不來
https://ithelp.ithome.com.tw/upload/images/20221105/201492679pRZYIvu9A.jpg

https://ithelp.ithome.com.tw/upload/images/20221105/20149267iYMN8vcp23.jpg

我要留言

立即登入留言