Day 2 關聯式資料庫簡介 - 實體與正規化 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

第 12 屆 iThome 鐵人賽

DAY 2

Software Development

SQL 30天手把手入門系列第 2 篇

Day 2 關聯式資料庫簡介 - 實體與正規化

12th鐵人賽 sql

smlpoints

團隊Outcome First

2020-09-15 10:21:14

6573 瀏覽

分享至

關聯式資料庫 (Relational Database)是奠基在實體關聯模型(Entity-Relationship Model, ER Model)上的資料庫。每個資料庫內會包含兩個或是兩個以上的資料表所形成的組合。

實體關聯模型

實體 (Entity) 是一個離散物件，我們可以簡單的把它當作「名詞」來看待。而關聯則是描述兩個實體間的聯繫，也可以把它當作「動作」。

例子：

公司擁有員工
主持人手上擁有節目

實體和關聯各自本身，都可以擁有其屬性。若以上頭的例子來看：

公司可以有「名字」的屬性，表達公司名字
公司擁有員工，這個「擁有」動作有個「日期」，代表員工進入這家公司的時間

資料表正規化

使用「關聯式資料庫」之前要作做的事

既然關聯式資料庫的組成是一張張的表格，若要確保每張資料表的一致性和完整性，那必須要達成以下條件：

表格和表格間的關係：用共同的欄位連結
資料按性質不同，妥善命名存放

若今天有以下兩張資料表，記錄下 A 公司旗下的眾多子公司和分類：

子公司列表

id	name	CategoryID
1	ASub1	1
2	ASub2	2

分類列表

id	name
1	Retail
2	Manufacturing

透過 CategoryID 跟分類列表內的 id 兩個值，便將這兩個表連結起來了。前者 CategoryID 稱為外鍵 (Foreign Key, FK)；後者稱為主鍵 (Primary Key, PK)。

正規化(Normalization)是什麼？為什麼要做？

正規化可以想成在存入資料到資料庫前，先除去資料中多餘的部份，以減少儲存空間的浪費，同時還可增進查找效率。

當你發現每一張資料表，都只呈現一件事實的時候，那麼正規化的效果就達成了

下方例子是一張尚未正規化前的個人資料表：

name	email	city
Mike	mike@example.com	台北
Andy	andy@gmail.com	桃圓
Cindy	cindy@gmail.com	桃圓

我們可以先對這表單進行 1st 正規化 變成以下：

id	name	email	city
1	Mike	mike@example.com	台北
2	Andy	andy@gmail.com	桃圓
3	Cindy	cindy@gmail.com	桃圓

上圖的個人資料表中加入了主鍵 id，同時每一個欄位也僅一筆內容。若有不相關的內容，應該要改放到其他的資料表中存放。但這樣的個人資料表，若我要新增或更改城市名稱時，便會造成困擾。例：使用者現在發現他把「桃園」誤植為「桃圓」，若要修改得一筆筆改動，隨著資料量增加，出錯機會也會隨之上升。

因此，將城市名稱另外建立一個表單，並建立關聯，最後形成許多組一對多的關係，完成 2nd 正規化。

id	name	email	CityID
1	Mike	mike@example.com	1
2	Andy	andy@gmail.com	2
3	Cindy	cindy@gmail.com	2

id	name
1	台北
2	桃園

如果資料表比較單純，那做到這個階段就可以結束了。不過當你發現在做完 2nd 正規化 後，在一個表單中仍有發現相依的情況，那就還可以再進行3rd 正規化。
如以下做完 2nd 的正規化訂單資料表：

id	CustomerID	customerName	staffName	StaffID
1	1	Tommy	Ken	1
2	2	Jennifer	Hans	2
3	3	Jacky	Hans	2

如上表，顧客 ID 、顧客名字、職員名字和職員 ID 這四個欄位整體跟訂單編號有關，但單看「顧客 ID 、顧客名字」和「職員名字和職員 ID」這兩組，其實都可以分拆出去。

所以 3rd 正規化 後會變成三張資料表：

id	name
1	Ken
2	Hans

id	name
1	Tommy
2	Jennifer
3	Jacky

id	CustomerID	StaffID
1	1	1
2	2	2
3	3	2

要正規化到多徹底？

換個角度思考：過多層的正規化，在取用資料時，使用者就得多利用幾次或是幾層的 JOIN (關聯)指令，才能取得完整資料。如此一來，這樣較為複雜的查詢指令，會不會產生讓使用者得以察覺的效能降低？查遍網路上大眾的說法，普遍認為至少做到三層的正規化是基本的。

正規化資料表後，下一個要思考的問題是你的資料表的關聯類型，可分為一對一、一對多、多對多三種，就留待明天的篇幅再行簡介了。

Day 1 - SQL 的發展簡史和資料庫流派

Day 3 關聯式資料庫簡介 - 常用專有名詞和關聯

系列文

SQL 30天手把手入門共 30 篇

RSS系列文訂閱系列文

41 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

stanley_zizi_881212

iT邦新手 5 級 ‧ 2026-05-27 01:11:21

20260527_簽到

回應
檢舉

登入發表回應

我要留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

SQL 30天手把手入門系列 第 2 篇