iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
AI & Data

預測惱人的人事物:跟我一起學習如何用資料分析來避開他們 系列

只要是動物,哪怕還有一口氣在,就會有針對環境的情緒及反應。或許你的貓不喜歡被搔癢,每搔必咬;隔壁的狗狗討厭電蚊拍的聲音,聽到就會到桌底躲起來,後來才知道電蚊拍的聲音意味夜晚到來,原來他也害怕黑暗。

在搬到新的租屋處後,隔壁樓下的餐廳廚房人員只要下班,收拾完畢後,關門必甩,真是簽約當下始料未及。原本的無奈逐漸轉為習慣,還惡趣味地開始將不固定時間的關門聲,以隨性的方式記錄下來,竟然也累積了一定的量。起初還期待練就火眼金睛找到規律,但可能是所謂工程師魂的莫名堅持作祟,便將「透過資料分析來預測關門」這項專案列入 side project 的待處理清單。

你,準備好跟我一起完成了嗎?

鐵人鍊成 | 共 38 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 1

前言 & 章節架構

只要是動物,哪怕還有一口氣在,就會有針對環境的情緒及反應。或許你養的貓不喜歡被搔癢腳底,每搔必咬;隔壁的狗狗討厭電蚊拍的聲音,聽到就會到桌底躲起來,後來才知道因...

2022-09-16 ‧ 由 kawayan_lin 分享
DAY 2

釐清問題與設計解決方案:目前的資料長什麼樣 & 放在哪裡

第二篇開始就不多說,讓我們直接切入正題吧! 資料的特性 上一篇提到,我會「不定期」、「隨性地」記錄聽到的關門聲。之所以是不定期而非每天,是因為客觀因素:有時候是...

2022-09-17 ‧ 由 kawayan_lin 分享
DAY 3

釐清問題與設計解決方案:該怎麼達成 & 兼談專案執行

以終為始 筆者過往曾自修專案管理課程,雖然沒有直接擔當 PM 或其他管理角色,但這些知識一直以來皆成功運用在過往的工作(如規劃個人 sprint 的時程)以及學...

2022-09-18 ‧ 由 kawayan_lin 分享
DAY 4

資料結構化與清洗:因為雜亂無章,所以需要

為什麼資料需要清洗 各位都應該有看過網路新聞的留言板吧?底下除了針對新聞的實質留言以外,還充斥著各種針對執政者、意見相左的人、甚至不認識的路人的謾罵批評等等,與...

2022-09-19 ‧ 由 kawayan_lin 分享
DAY 5

結構化實作 Part 1:將記錄從 Google Keep 輸出

從 Google Keep 輸出成 Google Doc 首先,讓我們按下 Keep 記事底下的這三個點: 等待轉換完畢後,頁面左下角會出現一個連結,點擊「開啟...

2022-09-20 ‧ 由 kawayan_lin 分享
DAY 6

結構化實作 Part 2:清洗雜質 & 加入必要符號

在將原始資料轉換成 JavaScript 的 array 之後,我們可以開始來寫程式了。 此段需求細節 希望可以將資料分成兩類 符合我們預期格式的 不符合的...

2022-09-21 ‧ 由 kawayan_lin 分享
DAY 7

結構化實作 Part 3:透過 regex 處理資料 & 分類

在完成基本的清洗及加工後,我們要來針對每筆資料進行細緻的處理與分類。 結構化 在上篇最後,我們將初步處理過的字串用半形空白分割成 splittedStrArr。...

2022-09-22 ‧ 由 kawayan_lin 分享
DAY 8

結構化實作 Part 4:輸出成 CSV & 確認處理情形

存成 CSV 為什麼要選擇 CSV 的三大理由 CSV 建立方便,且人類易讀、易修改 純文字,所以可以在任何編輯器操作(記事本、文字編輯、vscode、ms...

2022-09-23 ‧ 由 kawayan_lin 分享
DAY 9

結構化實作 Final:處理遺漏項目 & 手動微調

昨天發現程式處理完的結果跟我們設想的不太一樣,所以今天讓我們針對以下兩點來微調吧! 星期幾 經過思考後,決定統一成小寫,之所以不採用大寫的理由是: 大寫的感覺...

2022-09-24 ‧ 由 kawayan_lin 分享
DAY 10

系列文架構調整:時間不夠了,該怎麼辦?

要跟讀者說不好意思了,本系列文將進行第一次的變更。 TL;DR 此系列仍會完賽,時間分配上以每日 2 小時以內為原則。 30 天內處理不完的部分,仍然會繼續寫...

2022-09-25 ‧ 由 kawayan_lin 分享