接續昨天,如果數據的型態不統一會影響到後續操作的成敗,所以接下來要介紹一個重要的功能《轉換(Transform)》
我們先回復成昨天數字化前的狀態,順便介紹另一個功能《回推》,在左邊的狀態爛上面可以看到,我們按Undo / Redo下去後可看到下圖,藍色框框的部分是我們目前的狀態,細看一下裡面寫的,它說把established欄位裡的4375筆資料轉換為數字,這部分的進度我們不要了所以我們選擇上一個來回推
可以看到原本被數字化的被回復了
接著我們選擇在該欄位的下拉式選單選擇《轉換(Transform)》
會看到如下圖的介面,可以根據習慣選擇GREL、Python、Clojure這三種語言去編寫你的轉換流程
以我們剛剛遇到的問題來舉例,在established這個欄位裡的資料有些是英文跟數字夾雜的導致OpenRefine的數字化功能無法正常運作,那我們就可以自己撰寫一套邏輯來轉換,以下是個簡單的範例
可以看看《回推》的地方,它說有5510筆資料被轉換了,我們總比數也是5510,代表我們把所有的資料都轉換過一次了,《轉換(Transform)》在OpemRefine中算是常用的功能,可以多多熟悉