iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

吵什麼 AI 煉金術?!你家有礦嗎?(資料領域必知的 30 個詞彙) 系列

AI 若是黃金,資料就是礦脈。
2015 年以大數據為題創業時,當時大家只想要機器學習模型不管資料。2017年便與開源社群夥伴一起發起台灣資料工程協會,擔任常務理事至今,終於盼到資料被大家普遍重視,反應在資料工程師的短缺與節節高漲的薪資水準上,以及「資料治理」議題的崛起。
2022 年開始推廣「資料治理」框架時,赫然發現除了少數產業,大家對於資料領域常見的系統與概念詞彙定義,仍有許多混淆不清之處。於是,Anna 來了!
想跟大家叨叨資料領域必知的 30 個詞彙,希望可以幫助大家在資料專案中溝通更順暢,作為使用者需求明確,作為開發者交付準確。少點雞同鴨講,多一點雞犬升天。

鐵人鍊成 | 共 30 篇文章 | 29 人訂閱 訂閱系列文 RSS系列文
DAY 1

30 個資料領域詞彙一覽與前言

簡單說,這 30 個詞彙是衡量家裡有沒有礦的方式之一。 所有的組織與個人都有資料,就像整個地球的地底下都有礦物,但是有經濟價值可開採的礦藏需要符合一定的標準。通...

2023-09-04 ‧ 由 Anna Yen 分享
DAY 2

DIKW & 資料的層次(Data, Information, Intelligence)

資料的層次 2020 年受邀到台北商業大學授課,當時為了讓同學們了解「資料的層次」,以及“data”、“information”、“file”與“Big dat...

2023-09-05 ‧ 由 Anna Yen 分享
DAY 3

Database 資料庫系統(vs. 資料倉儲 vs. 資料湖泊)

「資料庫」不等於「資料庫系統」 中文的「資料庫」一詞在日常使用上,涵蓋電腦科學的 “database”(資料庫系統), 以及泛學科的 “Lists of dat...

2023-09-06 ‧ 由 Anna Yen 分享
DAY 4

Metadata 詮釋資料 (分離資料儲存與資料取用)

為什麼要在 Data & AI 領域討論 Metadata 呢? 因為它是資料庫系統中的指南針。 Metadata 的中文譯名問題 元數據:中國大陸用語...

2023-09-07 ‧ 由 Anna Yen 分享
DAY 5

Data Warehouse 資料倉儲 (營運上各種光怪陸離的現象)

Data Warehouse(以下簡稱 DWH)這一塊目前仍然是百家爭鳴的狀態,應用架構與功能實際上沒有一個共通的業界標準。前一篇談到 DWH 時,歸類為儲存結...

2023-09-08 ‧ 由 Anna Yen 分享
DAY 6

SQL 結構化查詢語言(& NoSQL 雜談)

SQL 是指稱一種 Query Language(查詢語言)。NoSQL 是指稱某一類型的 Databases(資料庫系統)。 這兩個詞彙不算同類。但是,常常會...

2023-09-09 ‧ 由 Anna Yen 分享
DAY 7

Business Intelligence 商業智慧

今天偶然聽到一位策略顧問的分享。她說在顧問領域也有鄙視鏈,為首是 Strategy Consultant(策略顧問),然後是 Management Consul...

2023-09-10 ‧ 由 Anna Yen 分享
DAY 8

Data Lake 資料湖泊( 與一隻黃色小象 Hadoop 的時代)

終於講到我的 Home turf(主場、地盤)!(什麼叫做主場?就是沒 Google search 的前置作業需求) 2015 年我踏入大數據領域,在此之前我只...

2023-09-11 ‧ 由 Anna Yen 分享
DAY 9

Massive Parallel Processing(MPP vs. Hadoop)

本篇還是會再提 Hadoop,以對照 MPP 的特點。Massive Parallel Processing(MPP) 實際上是一種架構。理論上依據應用場景,M...

2023-09-12 ‧ 由 Anna Yen 分享
DAY 10

Data Visualization 資料視覺化(vs. BI 商業智慧)

為什麼我會想寫 30 個資料領域詞彙系列呢?資料領域加上 Information Technology,如此深廣的領域,豈是三十天用每天幾百字可以說清楚?我也...

2023-09-13 ‧ 由 Anna Yen 分享