在上一篇,我們介紹了元數據的幾個關鍵實體。今天我想深入聊聊 Business Glossary 業務詞彙 的內部結構。
很多企業做治理,死就死在「把業務詞彙做成了一個平鋪直敘的 Excel 清單」。當詞彙量到了 500、1000 個的時候,沒有結構的詞彙表就是一場災難。大家都在定義「客戶」,但業務部的客戶是有下單的,行銷部的客戶是拿著名片的,IT 部的客戶是 Customer 表裡的 ID。
為了收拾這個「名詞大亂燉」,我們參考了成熟的方法論並結合實務,制定了一套 由上而下的五層式結構。這不僅僅是為了分類,更是為了劃分權責,並將抽象的業務概念錨定到具體的資料實體上。
這五層分別是:
領域 (Domain) > 子領域 (Sub-Domain) > 業務對象 (Business Object) > 資料標準 (Data Standard) > 屬性 (Props)。
這兩層設計的目的非常單純:「找人」。
資料治理最怕的就是「三不管地帶」。我們從領域出發,讓對應的業務單位「認領」資料。
領域 (Domain):對應企業的一級價值鏈。
例如:製造 (Manufacturing)、銷售 (Sales)。
這代表該領域的最高主管(如廠長、銷售總監)要為底下的資料負責。
子領域 (Sub-Domain):領域內部的慣用分類法。
這層很靈活,依據各單位的管理習慣。
例如在 製造領域,他們習慣用 人機料法環 (4M1E) 來管理,那子領域就可以分 人員、機台、物料、工法。
這讓業務單位覺得「這是我的資料」,而不是 IT 強加給他們的分類。
這一層是概念層,用來聚合相關的資料標準。它已經很貼近業務實作與 IT 系統的邊界了。
例如在銷售領域下,客戶 (Customer) 就是一個業務對象。但光定義到這裡是不夠的,因為這就是大家最愛吵架的地方——「什麼是客戶?」
這時候,我們需要第四層來定錨。
這是我們方法論中最核心的觀點。
以前我們做詞彙定義,往往隨便定義一個「客戶」,然後要業務單位來解釋。結果業務單位基於不同情境(ERP、CRM、派工系統)各自表述,永遠吵不完。
後來我們發現,最穩定的定義,其實就是** Table or View**本身。
一個表格,就代表了一個明確的、被系統固化的業務定義。因此,我們將 Data Standard (資料標準) 這一層,直接對應到 Data Catalog 中的 Table。
舉個經典的例子:
業務口中都在聊「客戶」,但在我們的架構中,這是兩個不同的 資料標準:
資料標準 A:Sales_Customer (交易客戶)
定義:指已完成首筆交易,並正式登錄於 ERP 系統的主檔資料。
對應實體:ERP DB 中的 T_CUST_MASTER 表。
資料標準 B:Pre_sales_Customer (潛在客戶)
定義:指處於商機階段,尚未交易,僅存在於 CRM 系統的名單。
對應實體:CRM DB 中的 T_LEAD_INFO 表。
透過將「資料標準」與「表格」綁定,我們消滅了模糊空間。當業務說「我要看客戶資料」時,我們能精準反問:「你要看的是 Sales_Customer 還是 Pre_sales_Customer?」
掌握了資料標準後,最後一塊拼圖就是 屬性 (Props),全稱為 Properties。
這一層直接對應到資料庫中的 Column (欄位)。
我們常說:「沒有 Props 的定義是沒有意義的。」
就像給你一個 Excel 檔,檔名寫著「成交客戶 (Data Standard)」,但打開來裡面沒有標頭,只有一堆 123, John, 2023-01-01。你根本不知道 John 是聯絡人還是負責業務?2023-01-01 是生日還是成交日?
Props 就是在描述資料標準內部的細節特徵:
在 Pre_sales_Customer 這個標準下,我們必須定義:
Prop 1:客戶名稱 (對應 Column: lead_name)
Prop 2:創建日期 (對應 Column: create_date)
Prop 3:所在國家 (對應 Column: country_code)
只有定義到了 Props 層級,這份資料治理才具備真正的「使用價值」。
總結:五層架構全景圖
這個架構讓我們的業務詞彙從「抽象概念」一路落地到「物理欄位」:
下篇預告
既然我們確立了「資料標準 = Table」以及「Props = Column」這個核心觀念。
那麼,在定義一個資料標準和 Props 時,我們具體應該要寫些什麼?只是寫個中文名稱就夠了嗎?當然不夠。
下一篇,我們將進入實戰操作的細節,詳細講解 資料標準 & Props 內部應該要標註哪些元數據 (Metadata),才能讓這份定義真正好用。