匯入的資料通常不能馬上利用,像是日期、地址的處理是我們要近一步調整的。比如地址包含臺北市中正區忠孝西路x段x巷x號的門牌號碼,但這都只是分區的資料,不能直接運用,此時只要點該 Column 任何一儲存格,點選最上層索引標籤「轉換(原地改變,原來資料會不見)」或「新增資料行」的方式,把「台北市」切出來;以「新增資料行」為例,再點按「長度」➫ 選儲存格 ➫ 首頁的「分割資料行」➫ 依字元數,在字元數打 3、選「最左邊一次」的分割 ➫ 確定,就能把「台北市」切割出去另一個獨立 Column,再根據它的屬性修正名稱。右側的查詢資料欄位會多出兩個步驟:已變更類型、已重新排序資料,每個步驟在執行後都會被放到右側的查詢設定步驟、並給出程式碼,我們不用學怎麼寫這些程式碼,但事後可以收集來用。
手上日期資料想拿來做年、季、月報,假設資料型態是 1090923,因為年份可能有兩位數(99 年以前),從右邊切才不會產生錯誤。接著,點首頁的「分割資料行」➫ 依字元數,在字元數打 2、選「最右邊一次」的分割 ➫ 確定,就能把「日」切割出去;要轉成標準西元日期,還要把年跟月的數字做處理,照著處理「日」的方式操作一次,「月」就被分出來了。但因為「年」還是民國,要校正成西元的話,點該資料行任一儲存格,點選最上面索引標籤的「轉換」➫「標準」➫「加」1911 ➫ 確定,就換成西元的年份了。但到目前為止,年月日還是三個獨立的 Column,因此把它們按 Shift 全選後,按「轉換」➫「合併資料行」➫「分隔符號」選自訂並在下方方塊打「/」、新資料行名稱打「交易日期」➫ 確定,這三行就會合併在一起,但此時的資料類型還是文字,因此在「轉換」➫「資料類型」➫「日期」,如此就完成日期欄位的正規化了!
而在一個 Column 內可能有多種類別,比如建物型態包含公寓、住宅大樓、套房、工廠、店面、華廈... 等,如果我們只想要選取其中幾類做後續分析,可點該總欄位儲存格右側的小箭頭,在「文字篩選」的方框去做勾選,就能過濾、移除我們不需要的資料。右側查詢設定又會在我們這些後續的操作下出現許多步驟,如果往後我們還會再做類似的動作、想收集程式碼,可以在選了想要的步驟以後,按「首頁」➫「進階編輯器」➫ Control + A 全選程式碼 ➫ 複製貼到記事本,以後有相同的資料庫處理需求就可以直接貼上,不用做第二次處理,快速有效率。想要嘗試使用的話,可以在前台點「資料」➫「新查詢」➫「從其他來源」➫「空白查詢」➫「進階編輯器」➫ 貼上之前複製的整段程式碼 ➫ 完成,就能看到資料從匯入到原本已經處理的過程全都做好了。重點是處理好後,一定要記得按左上角的「關閉並載入」,才能成為實體資料哦!