iT邦幫忙

2022 iThome 鐵人賽

DAY 7
1

在數據挖掘中,數據的好壞關乎到後續分析的過程,所以是很重要的一個部分,那今天我們就來學習自己建數據,並用Orange呈現與儲存看看拉~(♡˙︶˙♡)

Google 試算表

這次我用的是Google的試算表來打資訊,所以凡是有網路的你,皆能自己創造數據喔~

第一步 將類別以及資訊條列打出

因為此筆數據是為了預測性別為何,所以我在其中的類別輸入一些人體身上的特徵。
https://ithelp.ithome.com.tw/upload/images/20220922/20151063fftGeJ4lEO.png

第二步 按共用儲存連結

大家記得不要用到只限制自己看得到的連結喔,如果這樣的話,後續Orange 的File呈現會出不來
https://ithelp.ithome.com.tw/upload/images/20220922/20151063nua9ItbIxq.jpg

Orange

打開File,將連結匯入

https://ithelp.ithome.com.tw/upload/images/20220922/201510634EKzZjE3eH.png

調整屬性

  • 第一種方式,直接於File調整
    https://i.imgur.com/7RVEok3.gif
  • 第二種方式,運用Select Columns調整target
    https://ithelp.ithome.com.tw/upload/images/20220922/20151063UT1Qf1VlYu.jpg
    https://i.imgur.com/vRSkXM1.gif

連接Data Table查看成效

https://ithelp.ithome.com.tw/upload/images/20220922/20151063DM4X0zs7tc.png

運用Save Data,選擇是否要將檔案存於電腦中

https://ithelp.ithome.com.tw/upload/images/20220922/20151063bvJOXmmAlt.jpg
儲存後會是.tab檔,就是無逗點符號之檔案,如以下圖所示。
https://ithelp.ithome.com.tw/upload/images/20220922/20151063jA14u24xez.png
為了讓數據更完善,我們可以回試算表,在第一列下方插入兩列,補充它們的類別屬性。
s- String , d- 離散數, c- 線性數
https://ithelp.ithome.com.tw/upload/images/20220922/201510639Qt6bPHELp.png
到此,這算是一份完整的數據囉,今天就先這樣啦~明天我們再繼續加油!/images/emoticon/emoticon08.gif

參考資料:
Orange


上一篇
〔Day6〕練習小實作-Scatter Plot
下一篇
〔Day8〕淺談階層式分群法(Hierarchical Clustering)
系列文
一同來挖掘 0 程式的Orange!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言