Day 6｜貓咪的持久化 🐾 (上)：認識 JPA、Hibernate、Spring Data

2025 iThome 鐵人賽

DAY 6

Software Development

Spring 冒險日記：六邊形架構、DDD 與微服務整合系列第 6 篇

17th鐵人賽 @jpa @hibernate @spring data

vanillasky

團隊B33F 50UP

2025-09-20 23:59:16

426 瀏覽

分享至

前言

我們要讓 java core app 能把資料存進資料庫，這樣 line bot 未來再把這些資料回傳給使用者。在實作前，先來釐清幾個觀念：Relational Database、SQL、JPA、Hibernate、Spring Data、ORM。

Persistence Layer

Persistence Layer 的目標是讓 in-memory 的 Java Objects 可以 outlive 在應用程式之外，也就是說，把 Java Objects 存到資料庫。

不過 Java 跟資料庫天本來就有許多邏輯上的落差，造成存取的一些問題，這就是所謂的 object-relational mismatch。接下來以關聯式資料庫 (Relational DB) 來說明。

5 mismatchs（Java Object vs. Relational DB）

在《Java Persistence with Spring Data and Hibernate》裡，作者總結了五個典型問題：

1. Granularity Problem

Java 可以有複雜的物件，但 SQL 會把物件 flatten 成多個columns

class Cat {
    Long id;
    String name;
    Address address; // embedded object 
}

class Address {
    String street;
    String city;
    String zipcode;
}

In SQL:

CREATE TABLE CATS (
    ID BIGINT,
    NAME VARCHAR(100),
    STREET VARCHAR(100),
    CITY VARCHAR(100),
    ZIPCODE VARCHAR(20)
);

2. Inheritance Problem

Java 常見的 OOP inheritance 在 SQL 沒有直接對應的邏輯。要一張表還是多張表？

class Cat {
    Long id;
    String name;
}

class RussianBlue extends Cat {
    String furColor = "Gray";
}

class Persian extends Cat {
    Boolean needsDailyGrooming = true;
}

In SQL 你可能就用單表的策略來處理，沒有的欄位就 null

CREATE TABLE CATS (
    ID BIGINT,
    NAME VARCHAR(50),
    FUR_COLOR VARCHAR(50),         -- 只有 RussianBlue 用
    NEEDS_DAILY_GROOMING BOOLEAN   -- 只有 Persian 用
);

3. Identity Problem

Java 有 ==（看 object reference）和 equals()（看equals實作的邏輯）。
SQL 的相等則是 primary key 相同 (only one identity per primary key)
所以同一筆 row 可能同時被 Java 建立成多個 instance。

Cat c1 = new Cat(1L, "Mimi");
Cat c2 = new Cat(1L, "Mimi");

System.out.println(c1 == c2);      
System.out.println(c1.equals(c2));

In SQL:

SELECT * FROM CATS WHERE ID = 1;

4. Association Problem

Java 可以用一連串的 getter 來 access data
SQL 則必須透過 foreign key 與 join table 。-> links by keys

cat.getCatDetails().getShelterNumber();

But in SQL:

class Cat {
    Long id;
    CatDetails catDetails;
}

CREATE TABLE CAT_CATDETAILS (
    CAT_ID BIGINT,
    CATDETAILS_ID BIGINT,
    PRIMARY KEY (CAT_ID, CATDETAILS_ID)
);

5. Navigation Problem

Java 可以用 nested for loop 一路取資料。
SQL 可能會導致 N+1 問題，效率大幅下降。

for (Cat cat : owner.getCats()) {
    for (Snack snack : cat.getSnacks()) {
        System.out.println(snack.getName());
    }
}

In SQL:

SELECT * FROM OWNERS WHERE ID = 1;              -- 找到飼主
SELECT * FROM CATS WHERE OWNER_ID = 1;          -- 找到飼主的貓咪
SELECT * FROM SNACKS WHERE CAT_ID = ?;          -- 每隻貓咪都要查一次 (N 次)

lazy loading & n + 1 selection

想像你有一個 Owner 物件，裡面關聯了好多 Cat。

Owner owner = em.find(Owner.class, 1L);  
for (Cat cat : owner.getCats()) {
    System.out.println(cat.getName());
}

Lazy Loading 發生了什麼？

ORM（e.g. Hibernate）預設常用 lazy loading：
🐱 一開始不會把所有貓的資料一次載入，只載入 Owner。
🐱 當程式第一次呼叫 owner.getCats()，它才真的去 SQL 撈貓咪。

N+1 Problem 是甚麼？

第 1 次查詢 (The 1 in N+1)

SELECT * FROM OWNERS WHERE ID = 1;

接著 N 次查詢 (The N in N+1)

SELECT * FROM CATS WHERE OWNER_ID = 1;   
SELECT * FROM CATS WHERE OWNER_ID = 1;   
SELECT * FROM CATS WHERE OWNER_ID = 1;   
...

你先問Owner是誰然後接下來每叫一隻貓，都要跑去資料庫問一次：「OWNER 1 的第 n 隻貓是誰？」大量的資料庫查詢操作非常慢。

你可能要想一些 sql 的解法來處理: 直接用 JOIN 或 fetch join 把 Owner 和 Cats 一次查回來：

SELECT * 
FROM OWNERS o
INNER JOIN CATS c ON o.ID = c.OWNER_ID
WHERE o.ID = 1;

這樣一查就拿到所有貓咪，省去重複查詢。

為什麼需要 JPA / Hibernate / Spring Data？

方便操作讓 developer 可以著重在 bussiness logic，而且 Hibernate跟 Spring Data JPA 已經幫我們做了一些好用的 features 跟優化。

JPA是一個 specification，當有人說他用了 JPA 是指他用了一個基於 JPA 這個specification的 technology (an implemantion)。JPA定義了 java application 跟 db 互動的 interface。Hibernate 則是一個基於 JPA specification ORM 框架的技術。

直接用 JDBC (a vanilla way to connect db in java)當然能操作 DB，但這樣的操作最底層的方式有一些 disadvantages

boilerplate code 很多
還要自己管理連線、mapping、transaction
不是 JDBC 不好，每個 solution 都有它適合的情況，例如你要特別優化或客製化某個部分。

所以在大部分應用中，我們會用更 high level 操作 db:

JPA：
- 只是一個規範（specification）。定義了應用程式怎麼跟資料庫互動。
- 最初屬於 Java EE，現在由 Eclipse Foundation 維護。
Hibernate：
- 最流行的 JPA "implementation"。( built on top of JDBC )
- 也加了很多額外功能 caching, batch processing, and other performance enhancements.
Spring Data JPA：
- 比 Hibernate 再更上一層。(不是 JDBC 的替代，也不是 ORM 本身，請看下方的圖)
- 把 Repository pattern 自動化，讓 CRUD 幾乎不用寫 SQL。

Persistence Context 與 EntityManager

使用基於 JPA 的科技會為引入一層 middle layer (context) 來幫助管理物件的操作。

(From LAURENŢIU SPILCĂ's yt: Laur Spilca)

What is this middle layer doing?

想像如果你的每一個操作都要直接跟 DB 互動，效率會很差。試想有一個 middle layer 它可以幫忙先 "統整" 所有物件的操作，這些變更不會立刻送到資料庫，而是先被放到這個 context 裡統一追蹤，最後在 flush 或 commit 的時候，EntityManager 會整理出一份『變更名單』（新增、修改、刪除）並一次性執行對應的 SQL。

這樣可以避免每次 setter 都馬上發 SQL 減少時即對 db 的操作，不過有時候反而會因為 Lazy Loading 或 N+1 (Navigation Problem) 造成更多查詢。

那這個中間層我們稱他為 peristence context 在 perisistnece context 管理物件的 API 類別稱 EntityManager 。 manager 負責追蹤所有被管理的 entity（也就是帶有 @Entity 的物件）。

JPA 的核心概念是 Persistence Context
管理 Persistence Context 的就是 EntityManager。
EntityManagerFactory 用 Persistence.createEntityManagerFactory() 時有兩個配置來源：
- XML (persistence.xml)：傳統做法，persistence.xml。
- 直接在 java code 配置：可以傳入 Map 或是 application.properties。

(EntityManager 是 factory pattern 你你要得到這個物件必須先有 factory ，再用 factory 去製造。)

不是每次操作增新刪除等等 save 就直接丟 SQL，而是先在 memory 追蹤 entity 的狀態，最後再一次 flush 到 DB。

// if we use xml to define our db
EntityManagerFactory emf = Persistence.createEntityManagerFactory("my-persistence-unit");

EntityManager em = emf.createEntityMannager();

try {
    em.getTransaction().begin()
        
    Cat c = new Cat();
    c.setId(1L);
    c.setName("vanillasky");
    
    em.persist(c); //add this to the context -> NOT AN INSERT QUERY, we have to think in ORM theroem
    em.getTransaction().commit();// the context is mirrored to the db
} finally {
    em.close();
}

What is ORM?

Jakarta Persistence API (JPA), formerly known as Java Persistence API, is a specification that defines a standard API for ORM frameworks. It dictates how an ORM should be implemented in the Java ecosystem. --Baeldung: Learn Hibernate and JPA

剛有提到 middle layer 的出現讓我們可以在 context 預先統計，那麼最後的「變更名單」要怎麼 map 過去? 那麼 ORM (an interface) 定義了如何幫我們把 Java 物件 ↔ SQL做轉換，而 Hibernate 則是常見的實作，遵循 JPA 並提供更多 features。藉由 jpa specification 中所定義的 ORM 幫助我們 "mapping 自動化"，降低了前面介紹的 5 paradigm mismatches。

Spring Data JPA

比 Hibernate 更上層，Spring Data 又再進一步：

透過 interface 定義 Repository，不用自己寫實作，跟之前提到的 OpenFeign 使用很像。
Spring Data 框架能直接解析 interface 裡面的 method 名稱，利用 JPQL 語法去自動生成對 DB 的操作。
整合 Spring Boot，幾乎不用自己配置 EntityManager。

public interface CatRepository extends JpaRepository<Cat, Long> {

    List<Cat> findByName(String name);
    List<Cat> findByFurColorContainingIgnoreCase(String colorKeyword);
    List<Cat> findTop5ByOrderByIdDesc();  // top 5 records

    List<Cat> findByOwner_Name(String ownerName);

    // direct use JPQL for customizatio of  join/fetch in avoidance of N+1 problem
    @Query("""
           select c from Cat c
           join fetch c.owner o
           where lower(o.name) = lower(:ownerName)
           order by c.id desc
           """)
    List<Cat> findLatestByOwnerWithOwnerFetched(@Param("ownerName") String ownerName);

    Optional<Cat> findByOwner_IdAndName(Long ownerId, String name);
}

@Query(nativeQuery = true) 可以直接寫 SQL

@Query(value = "SELECT * FROM cats WHERE name = ?1", nativeQuery = true)
    List<Cat> findByNameNative(String name);

但 JPQL 的好處是它跟 Java Entity 綁定，不依賴資料庫 vendor（跨 MySQL、Postgres 都能用）。

JPQL：寫 select c from Cat c → Hibernate 幫你翻成對應 SQL
Native Query：你自己寫 select * from cats，效能直接一樣，但你要根據你用的 db vendor 來寫

可以看情境使用:

JPQL : 使編寫更靈活，同時保持程式碼的readable and maintainable
Native Query : 想特別處理效能、用 vendor 特有語法（例如 LIMIT、ILIKE）

本系列文章會用到 Spring Data 下一章我們會繼續詳細學習實作以及配置 db 的部分~~

Spring Data method naming

Spring Data 會在 Spring 起動時把 method name 翻成 JPQL ，你不一定要寫 @Query 但這樣很侷限。

List<Cat> findByName(String name);

會被翻成類似 JPQL：

select c from Cat c where c.name = :name

因為 method 名稱一改，query 就壞掉，多人協作時要多注意，所以我都是

simple logic（findById、findByName）: 用 method name 生成。
complex logic（join、多 where）: 直接寫 @Query（JPQL 或 Native）。

Reference

LAURENŢIU SPILCĂ, Spring Start Here: Learn what You Need and Learn it Well
Catalin Tudose, Java Persistence with Spring Data and Hibernate

Day 5｜Echo 貓咪😸： Line Webhook & 自訂 Annotation

Day 7｜貓咪的持久化 🐾 (中)：Spring Data JPA、 DataSource、HikariCP

系列文

Spring 冒險日記：六邊形架構、DDD 與微服務整合共 10 篇

RSS系列文訂閱系列文

3 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

Spring 冒險日記：六邊形架構、DDD 與微服務整合系列 第 6 篇