iT邦幫忙

2022 iThome 鐵人賽

DAY 18
0

接續昨天,如果數據的型態不統一會影響到後續操作的成敗,所以接下來要介紹一個重要的功能《轉換(Transform)》
我們先回復成昨天數字化前的狀態,順便介紹另一個功能《回推》,在左邊的狀態爛上面可以看到,我們按Undo / Redo下去後可看到下圖,藍色框框的部分是我們目前的狀態,細看一下裡面寫的,它說把established欄位裡的4375筆資料轉換為數字,這部分的進度我們不要了所以我們選擇上一個來回推
https://ithelp.ithome.com.tw/upload/images/20220905/20129973gLVcwu86zB.png
https://ithelp.ithome.com.tw/upload/images/20220905/20129973TM50CakQhS.png
可以看到原本被數字化的被回復了
https://ithelp.ithome.com.tw/upload/images/20220905/201299730fm23F0kFO.png
接著我們選擇在該欄位的下拉式選單選擇《轉換(Transform)》
https://ithelp.ithome.com.tw/upload/images/20220905/20129973fxbvv8xmDt.png
會看到如下圖的介面,可以根據習慣選擇GREL、Python、Clojure這三種語言去編寫你的轉換流程
https://ithelp.ithome.com.tw/upload/images/20220905/20129973bkGevMEQ7z.png
以我們剛剛遇到的問題來舉例,在established這個欄位裡的資料有些是英文跟數字夾雜的導致OpenRefine的數字化功能無法正常運作,那我們就可以自己撰寫一套邏輯來轉換,以下是個簡單的範例
https://ithelp.ithome.com.tw/upload/images/20220905/20129973GzNkNcupeg.png
可以看看《回推》的地方,它說有5510筆資料被轉換了,我們總比數也是5510,代表我們把所有的資料都轉換過一次了,《轉換(Transform)》在OpemRefine中算是常用的功能,可以多多熟悉
https://ithelp.ithome.com.tw/upload/images/20220905/20129973QIK3s8uccA.png


上一篇
Day17 《OpenRefine》數值統計功能介紹
下一篇
Day19 《OpenRefine》排序(Sort)
系列文
數位中介法沒有屏蔽的 AI 大數據大補帖30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言