AI 若是黃金,資料就是礦脈。
2015 年以大數據為題創業時,當時大家只想要機器學習模型不管資料。2017年便與開源社群夥伴一起發起台灣資料工程協會,擔任常務理事至今,終於盼到資料被大家普遍重視,反應在資料工程師的短缺與節節高漲的薪資水準上,以及「資料治理」議題的崛起。
2022 年開始推廣「資料治理」框架時,赫然發現除了少數產業,大家對於資料領域常見的系統與概念詞彙定義,仍有許多混淆不清之處。於是,Anna 來了!
想跟大家叨叨資料領域必知的 30 個詞彙,希望可以幫助大家在資料專案中溝通更順暢,作為使用者需求明確,作為開發者交付準確。少點雞同鴨講,多一點雞犬升天。
簡單說,這 30 個詞彙是衡量家裡有沒有礦的方式之一。 所有的組織與個人都有資料,就像整個地球的地底下都有礦物,但是有經濟價值可開採的礦藏需要符合一定的標準。通...
資料的層次 2020 年受邀到台北商業大學授課,當時為了讓同學們了解「資料的層次」,以及“data”、“information”、“file”與“Big dat...
「資料庫」不等於「資料庫系統」 中文的「資料庫」一詞在日常使用上,涵蓋電腦科學的 “database”(資料庫系統), 以及泛學科的 “Lists of dat...
為什麼要在 Data & AI 領域討論 Metadata 呢? 因為它是資料庫系統中的指南針。 Metadata 的中文譯名問題 元數據:中國大陸用語...
Data Warehouse(以下簡稱 DWH)這一塊目前仍然是百家爭鳴的狀態,應用架構與功能實際上沒有一個共通的業界標準。前一篇談到 DWH 時,歸類為儲存結...
SQL 是指稱一種 Query Language(查詢語言)。NoSQL 是指稱某一類型的 Databases(資料庫系統)。 這兩個詞彙不算同類。但是,常常會...
今天偶然聽到一位策略顧問的分享。她說在顧問領域也有鄙視鏈,為首是 Strategy Consultant(策略顧問),然後是 Management Consul...
終於講到我的 Home turf(主場、地盤)!(什麼叫做主場?就是沒 Google search 的前置作業需求) 2015 年我踏入大數據領域,在此之前我只...
本篇還是會再提 Hadoop,以對照 MPP 的特點。Massive Parallel Processing(MPP) 實際上是一種架構。理論上依據應用場景,M...
為什麼我會想寫 30 個資料領域詞彙系列呢?資料領域加上 Information Technology,如此深廣的領域,豈是三十天用每天幾百字可以說清楚?我也...