iT邦幫忙

2023 iThome 鐵人賽

DAY 25
0

為何選擇資料目錄當作資料治理的起點?

資料產品是讓資料價值得以「兌現」的重要手段。一套能實踐且穩定執行的資料治理框架,必須要讓不同的角色受惠,並幫助企業產生並重複利用資料產品,進而加速或放大資料價值。

資料目錄是企業內跨部門最直接的、共享的資料服務。

Data Catalog(資料目錄)是什麼?

日常生活中,我們在購物前常會透過商品型錄(catalog)來確定標的是否能滿足我們的需求。
無論型錄被設計成如何,如果是現今的電商平台,有兩個已被使用者熟悉且滿意的核心操作流程:

  1. 瀏覽商品項目主列表,找尋可能符合自己需求的商品
  2. 點進單一商品,確認細部商品規格後下單

資料目錄的出現與操作模式,仿照了大家已經熟悉的消費商品流程:

  1. 瀏覽資料項目主列表,找尋可能符合自己需求的資料https://ithelp.ithome.com.tw/upload/images/20230928/20161790UMyuw5Q81n.png
    來源:數發部 - 政府資料開放平台
  2. 點進單一項資料,確認細部資料規格後下單(請求存取或直接下載)https://ithelp.ithome.com.tw/upload/images/20230928/201617900220PGnV0k.png
    來源:數發部 - 政府資料開放平台

資料目錄的特性

  1. 讓資料治理的成果具體可見 → 使用者須具備的技術門檻低,各資料團隊角色皆能接觸、操作。
  2. 技術上能被自動產製,不須要人工介入 → 因為資料目錄是透過掃描資料源的 metadata 而自動產生,不涉及商業邏輯的盤點、不須實際拉取資料, 故不須要人工介入產製資料目錄的整體流程。
  3. 幫助企業產生並重複利用資料產品 → 資料目錄已將資料陳列給使用者,資料團隊內的其他人員在溝通時不必再透過其他介面調查或申請資料,縮短產製資料產品所須投入的時間。

製作完資料目錄後,企業內的資料就如商品(Data Product)陳列在使用者觸手可及的位置。使用者們透過標籤、時間等資訊瀏覽這些項目,找出符合自己需求的資料並加以發想、提問、討論,大幅降低重複調查、製造已存在資料的時間。

[註記]本文基於我同事 Jim Lin 在內部專案研究成果。


上一篇
Data Validation(資料確效與資料產品)
下一篇
Metadata Management(企業資料架構的神經系統)
系列文
吵什麼 AI 煉金術?!你家有礦嗎?(資料領域必知的 30 個詞彙)30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言