iT邦幫忙

2022 iThome 鐵人賽

DAY 5
0
AI & Data

預測惱人的人事物:跟我一起學習如何用資料分析來避開他們系列 第 5

結構化實作 Part 1:將記錄從 Google Keep 輸出

  • 分享至 

  • xImage
  •  

從 Google Keep 輸出成 Google Doc

首先,讓我們按下 Keep 記事底下的這三個點:
https://ithelp.ithome.com.tw/upload/images/20220920/20141357B1YgFVRpBI.png

等待轉換完畢後,頁面左下角會出現一個連結,點擊「開啟文件」後進到 Google Doc 頁面:
https://ithelp.ithome.com.tw/upload/images/20220920/201413577Q03VwHm4x.png

預計使用技術

由於筆者對於 JavaScript 最熟悉,因時間關係,預計此次資料清洗與結構化的作業都會使用 JavaScript 來完成

手動加工

接著,我們要用程式來清洗、輸出並且結構化這些資料。但在進入實作之前,我們必須瞭解到要讓程式讀到 Google Doc 上面的資料是有困難的:

  1. 需要憑證來使用 Google Drive 的 API。
  2. 需要解析文件來取得純文字,因為文件內部包含許多看不到的資訊:樣式、換行、縮排等資訊,也是用程式碼的形式記錄的。

時間有限,我們選擇使用手動的方式來轉換這些資料。而且在很許多狀況(含此次),使用人工處理,並不會比較費時

人工處理第一步:去貼到 IDE 中除格式

首先讓我們建立一個名為「rawData」的 Markdown 檔案,並將 Google Doc 整份文件用 ctrl + A(或 cmd + A)全選複後,在「rawData」貼上。此份檔案作為備份

https://ithelp.ithome.com.tw/upload/images/20220920/20141357O6dYl3kIoO.png

人工處理第二步:使用 IDE 來針對每一行添加資訊

接著讓我們建立一個名為 dayTimeStructurize.js 的檔案,將 Markdown 中的所有內容貼到這邊,然後讓我們移到第一行的最後,按住 shift + 箭頭右,選取最後的換行處:

https://ithelp.ithome.com.tw/upload/images/20220920/201413571WwETjzrgg.png

按下 cmd(ctrl) + shift + L,選取文件內所有符合選取內容的其他內容:

https://ithelp.ithome.com.tw/upload/images/20220920/20141357MOEWAukHlg.png

移動游標,在結尾加上英文逗號「,」,並且在字串前後加上英文引號「"」:

https://ithelp.ithome.com.tw/upload/images/20220920/20141357qo6nvbR6PN.png

人工處理最後一步:變成 JavaScript 的 Array

最後讓我們把整段用中括號「[]」包起來,assign 成名為 arr 的變數。
https://ithelp.ithome.com.tw/upload/images/20220920/20141357CG8cKNEYen.png

(待續)


上一篇
資料結構化與清洗:因為雜亂無章,所以需要
下一篇
結構化實作 Part 2:清洗雜質 & 加入必要符號
系列文
預測惱人的人事物:跟我一起學習如何用資料分析來避開他們38
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言