iT邦幫忙

2

【資料治理實戰回憶錄】06. 業務詞彙的元數據規格書

  • 分享至 

  • xImage
  •  

我們在 拆解元數據 篇章中提到了業務詞彙在治理中的重要性。但在實務上,最常發生的災難就是大家打開 Excel,只填了「中文名稱」和「備註」,然後覺得治理做完了。

這種空泛的定義,對於自動化治理毫無幫助。

經過多次的迭代與磨合,我們總結出了一套 「業務詞彙標準結構 (Business Glossary Schema)」。這不僅僅是文件,它是業務端與 IT 端之間的 「資料契約 (Data Contract)」

以下我將先揭露這份 規格架構,接著用 人資領域的員工主檔 作為實戰範例。


第一部分:業務詞彙的標準結構 (The Schema)

一個完善的業務詞彙,內部必須包含以下欄位。我們將其分為 基礎識別核心定義品質與安全技術映射 四大類。

1. 基礎識別類 (Identification)

  • 業務詞彙類型 (Type)
    • 資料標準 (Data Standard):對應實體表格 (Table/Dataset)。
    • 屬性 (Attribute):對應一般欄位 (Column)。
    • 參照屬性 (Reference Attribute):對應外鍵關聯 (Foreign Key),指向另一個標準。
  • 業務詞彙領域 (Domain):該詞彙的歸屬領域(全類型適用)。例如:人資、財務、供應鏈。
  • 業務詞彙名稱 (Name):該詞彙的正式名稱(全類型適用)。包含英文(作為 ID)與中文(顯示用)。
  • 業務詞彙同義詞 (Synonym):該詞彙的常用別名(全類型適用)。方便使用者透過不同關鍵字搜尋。

2. 核心定義類 (Definition & Logic)

  • 業務詞彙定義 (Definition)
    • 該詞彙的詳細解釋(全類型適用)。
    • 重點:必須描述使用方法、業務含義與邊界範圍(Scope)。
  • 業務詞彙規則 (Business Rule)
    • 描述條件邏輯(全類型適用)。例如:計算公式、過濾條件、生效時間邏輯。
  • 參照屬性來源 (Reference Source)
    • 僅「參照屬性」適用
    • 描述該屬性的來源標準是誰。從 IT 角度看,就是 FK 指向哪個 Parent Table。

3. 品質與安全類 (Quality & Security)

  • 業務詞彙品質規範 (Quality Specs)
    • 僅「屬性/參照屬性」適用。這是自動化品質檢測 (DQ) 的依據。
    • 可否為空 (Nullable):Y/N。
    • 命名原則 (Naming Convention):例如 xxxx-xxxx 格式。
    • 有效值域 (Value Domain):例如 1 (男) / 0 (女),或 Regex 規則。
  • 機敏性 (Sensitivity)
    • 僅「屬性/參照屬性」適用
    • 分級:L1 (公開) / L2 (內部) / L3 (機密) / L4 (極機密)。
  • 法遵法規標籤 (Compliance Tags)
    • 僅「屬性/參照屬性」適用
    • 標記是否涉及:GDPR (歐盟個資法)、CCPA (加州個資法)、CRPA 等。

4. 權責與技術映射類 (Ownership & Technical Mapping)

  • 權責 (Ownership)
    • 僅「資料標準」適用(屬性預設繼承標準的權責)。
    • 包含四個關鍵角色:Data Owner (決策者)、Data Steward (定義者)、IT Product Owner (架構師)、IT Admin (維運者)。
  • 權威系統 (System of Record)
    • 僅「資料標準」適用。資料的源頭系統,例如 HR System (Workday)
  • 權威資料路徑 (Physical Path)
    • 全類型適用。
    • IT 端實際存取的物理位置,例如 hrdb.dbo.employee_master

第二部分:實戰範例 —— 員工主檔 (Employee Master)

理解了規格後,我們來看一個具體的例子。
假設我們要定義 HR 領域最核心的 「員工主檔」,它包含三個層次:

  1. 資料標準:員工主檔本身。
  2. 屬性:員工編號 (PK)、員工姓名 (PII)。
  3. 參照屬性:出生國家代碼 (FK)。

以下是填寫好的規格書範例:

1. 資料標準範例:員工主檔

元數據欄位 填寫內容
業務詞彙類型 Data Standard (資料標準)
業務詞彙領域 Human Resources (人力資源)
業務詞彙名稱 Employee Master (員工主檔)
業務詞彙同義詞 Staff List, 員工名冊, 人員主檔
業務詞彙定義 收錄公司所有「在職」與「留職停薪」之正式員工資料。不包含派遣人員、實習生與已離職超過 30 天之員工。
業務詞彙規則 1. 資料必須於員工報到日當天 09:00 前建立。2. 每日 T+1 凌晨更新。
權責 (Ownership) Data Owner: 人資長 (CHRO)Data Steward: 薪酬福利部經理IT Product Owner: HRIS 系統架構師IT Admin: HR 資料庫管理員
權威系統 Workday (HR Core System)
權威資料路徑 hrdb.dbo.t_employee_master

2. 屬性範例:員工編號 & 員工姓名

這裡展示一般屬性的定義,重點在於品質規範與機敏性。

A. 員工編號 (PK)

元數據欄位 填寫內容
業務詞彙類型 Attribute (屬性)
業務詞彙名稱 Employee ID (員工編號)
業務詞彙定義 員工在公司內部的唯一識別碼,用於所有行政流程與系統登入。
業務詞彙品質規範 可否為空: N (必填)命名原則: Emp_ID有效值域: E 開頭 + 5碼數字 (Regex: ^E\d{5}$)
機敏性 L2 (Internal / 內部公開)
法遵法規標籤 N/A
權威資料路徑 hrdb.dbo.t_employee_master.emp_id

B. 員工姓名 (敏感個資)

元數據欄位 填寫內容
業務詞彙類型 Attribute (屬性)
業務詞彙名稱 Employee Legal Name (員工法定姓名)
業務詞彙定義 員工身分證或護照上登載之法定全名。
業務詞彙品質規範 可否為空: N (必填)有效值域: UTF-8 字元,長度 < 50
機敏性 L3 (Confidential / 機密)
法遵法規標籤 GDPR, PDPA (標記後,系統可自動觸發個資盤點報告)
權威資料路徑 hrdb.dbo.t_employee_master.emp_name

3. 參照屬性範例:出生國家代碼 (FK)

這裡展示「參照屬性」的特殊性,它必須指向另一個標準。

元數據欄位 填寫內容
業務詞彙類型 Reference Attribute (參照屬性)
業務詞彙名稱 Birth Country Code (出生國家代碼)
參照屬性來源 ISO Country Code (ISO 國家代碼標準)來源表:refdb.dbo.t_country_iso
業務詞彙定義 員工出生地的國家代碼,採用 ISO 3166-1 alpha-3 標準。
業務詞彙品質規範 可否為空: Y (選填)有效值域: 必須存在於 ISO Country Code 標準清單中 (Referential Integrity)。
機敏性 L3 (機密) (國籍可能涉及種族隱私)
法遵法規標籤 GDPR (Sensitive Personal Data)
權威資料路徑 hrdb.dbo.t_employee_master.birth_country_code

結語:從「文件」到「智能」

透過上述的結構化定義,我們做到了兩件事:

  1. 區分了「屬性」與「參照屬性」:這讓我們能自動建立資料血緣 (Lineage),當「ISO 國家代碼標準」變更時,系統能自動通知 HR 系統管理員。
  2. 將「品質規範」代碼化有效值域 不再是寫給人看的文字,而是可以被轉換成 SQL 的驗證邏輯 (Data Quality Rules)。

這就是為什麼我們堅持業務詞彙必須要有嚴謹的結構。因為只有結構化的元數據,才能驅動自動化的資料治理。


圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言