2025 iThome 鐵人賽

DAY 22

Rust

Rust 逼我成為更好的工程師：從 Borrow Checker 看軟體設計系列第 22 篇

(Day22) Rust 零成本抽象與效能剖析：先對，再快

17th鐵人賽 rust

Sunny.Cat

2025-10-06 11:10:30

195 瀏覽

分享至

Rust 逼我成為更好的工程師：零成本抽象與效能剖析：先對，再快

在前面的篇章中，我們深入理解了 Rust 的所有權系統如何從根本上改變我們的程式設計思維。

今天我們要探討一個更深層的主題：零成本抽象 (Zero-Cost Abstraction) 與效能剖析。

Rust 的設計哲學是「先對，再快」——先用型別系統確保正確性，再談效能優化。

零成本抽象：不是口號，是合約

什麼是零成本抽象？

零成本抽象的核心概念是：你使用的抽象不應該帶來執行期的額外成本。

// 這個函式看起來很抽象，但編譯器會把它優化成最簡單的形式
fn process_data<T: AsRef<str>>(data: T) -> String {
    let s = data.as_ref();
    s.to_uppercase()
}

// 編譯器會把上面的程式碼優化成類似這樣：
// fn process_data_string(s: &String) -> String { s.to_uppercase() }
// fn process_data_str(s: &str) -> String { s.to_uppercase() }

Rust 的型別系統讓編譯器有足夠的資訊來做激進的優化。

所有權系統如何實現零成本抽象？

// 看起來複雜的借用檢查
fn complex_borrowing() {
    let mut data = String::from("hello");
    let reader = &data;        // 不可變借用
    let writer = &mut data;    // 可變借用
    // 編譯器會阻止這段程式碼，因為違反了借用規則
}

// 編譯器知道這些借用不會同時存在，所以可以安全地優化
fn safe_borrowing() {
    let mut data = String::from("hello");
    {
        let reader = &data;
        println!("{}", reader);
    } // reader 在這裡結束
    let writer = &mut data;    // 現在可以安全地取得可變借用
    writer.push_str(" world");
}

編譯器的優化策略：

內聯 (Inlining)：小函式直接展開，消除函式呼叫成本
死碼消除 (Dead Code Elimination)：未使用的程式碼被完全移除
常數折疊 (Constant Folding)：編譯期計算能確定的值
借用檢查優化：編譯器知道借用關係，可以安全地重排程式碼

剖析先於優化：猜測是最貴的優化

為什麼要先剖析？

// 看起來很慢的程式碼
fn naive_sum(data: &[i32]) -> i32 {
    let mut sum = 0;
    for &x in data {
        sum += x;
    }
    sum
}

// 看起來很快的程式碼
fn fancy_sum(data: &[i32]) -> i32 {
    data.iter().sum()
}

// 實際上，編譯器會把兩者優化成相同的機器碼

重點：直覺往往是錯的。真正的瓶頸可能不是你以為的地方。

使用基準化工具找出真相

// 使用 criterion 進行基準測試
use criterion::{black_box, criterion_group, criterion_main, Criterion};

fn bench_string_operations(c: &mut Criterion) {
    let data = "hello world".repeat(1000);

    c.bench_function("string_concat", |b| {
        b.iter(|| {
            let mut result = String::new();
            for _ in 0..100 {
                result.push_str(&data);
            }
            black_box(result)
        })
    });

    c.bench_function("string_format", |b| {
        b.iter(|| {
            let mut result = String::new();
            for _ in 0..100 {
                result = format!("{}{}", result, data);
            }
            black_box(result)
        })
    });
}

criterion_group!(benches, bench_string_operations);
criterion_main!(benches);

基準化工具的使用原則：

測量，不要猜測：用數據說話
測量多次：避免偶發性影響
測量真實場景：模擬實際使用情況
測量不同規模：找出效能曲線

效能剖析的實務工具

1. 編譯期優化標誌

// 在 Cargo.toml 中設定
[profile.release]
opt-level = 3        # 最高優化等級
lto = true          # 連結時優化
codegen-units = 1   # 單一代碼生成單元，更好的優化
panic = "abort"     # 減少二進制大小

2. 使用 cargo bench 進行基準測試

# 安裝 criterion
cargo install cargo-criterion

# 執行基準測試
cargo bench

# 生成 HTML 報告
cargo bench -- --output-format html

3. 記憶體剖析工具

// 使用 heaptrack 進行記憶體分析
// 在 Cargo.toml 中：
// [dependencies]
// heaptrack = "0.1"

fn memory_intensive_operation() {
    let mut data = Vec::new();
    for i in 0..1_000_000 {
        data.push(format!("item_{}", i));
    }
    // 分析記憶體使用模式
}

設計原則：先對，再快

1. 型別安全優先

// 好的設計：型別系統確保正確性
fn safe_divide(a: i32, b: i32) -> Option<i32> {
    if b == 0 {
        None
    } else {
        Some(a / b)
    }
}

// 編譯器會優化 Option<i32> 的表示，通常與 i32 相同大小

2. 零成本抽象優先

// 使用迭代器而不是手寫迴圈
fn process_items(items: &[i32]) -> Vec<i32> {
    items
        .iter()
        .filter(|&&x| x > 0)
        .map(|&x| x * 2)
        .collect()
}

// 編譯器會把這個優化成最高效的機器碼

3. 測量驅動的優化

// 先寫出正確的程式碼
fn find_max(items: &[i32]) -> Option<i32> {
    items.iter().max().copied()
}

// 然後測量效能
#[cfg(test)]
mod tests {
    use super::*;
    use criterion::{black_box, criterion_group, criterion_main, Criterion};

    fn bench_find_max(c: &mut Criterion) {
        let data: Vec<i32> = (0..10000).collect();
        c.bench_function("find_max", |b| {
            b.iter(|| find_max(black_box(&data)))
        });
    }

    criterion_group!(benches, bench_find_max);
    criterion_main!(benches);
}

總結：效能優化的正確順序

1. 先確保正確性

使用型別系統表達意圖
讓編譯器檢查不變式
寫測試驗證行為

2. 測量真實效能

使用基準化工具
測量真實場景
找出真正的瓶頸

3. 針對性優化

優化熱點程式碼
保持程式碼可讀性
記錄優化決策

4. 驗證優化效果

確保優化沒有破壞正確性
測量優化前後的差異
監控生產環境效能

Rust 的零成本抽象讓我們可以寫出既安全又高效的程式碼。
那更好的優化往往來自於更好的演算法和資料結構，而不是微優化。

Rust 逼我成為更好的工程師：從 Borrow Checker 看軟體設計系列第 22 篇

(Day22) Rust 零成本抽象與效能剖析：先對，再快

Rust 逼我成為更好的工程師：零成本抽象與效能剖析：先對，再快

零成本抽象：不是口號，是合約

什麼是零成本抽象？

所有權系統如何實現零成本抽象？

剖析先於優化：猜測是最貴的優化

為什麼要先剖析？

使用基準化工具找出真相

效能剖析的實務工具

1. 編譯期優化標誌

2. 使用 cargo bench 進行基準測試

3. 記憶體剖析工具

設計原則：先對，再快

1. 型別安全優先

2. 零成本抽象優先

3. 測量驅動的優化

總結：效能優化的正確順序

1. 先確保正確性

2. 測量真實效能

3. 針對性優化

4. 驗證優化效果

相關連結與參考資源

尚未有邦友留言

Rust 逼我成為更好的工程師：從 Borrow Checker 看軟體設計系列 第 22 篇

(Day22) Rust 零成本抽象與效能剖析：先對，再快

Rust 逼我成為更好的工程師：零成本抽象與效能剖析：先對，再快

零成本抽象：不是口號，是合約

什麼是零成本抽象？

所有權系統如何實現零成本抽象？

剖析先於優化：猜測是最貴的優化

為什麼要先剖析？

使用基準化工具找出真相

效能剖析的實務工具

1. 編譯期優化標誌

2. 使用 cargo bench 進行基準測試

3. 記憶體剖析工具

設計原則：先對，再快

1. 型別安全優先

2. 零成本抽象優先

3. 測量驅動的優化

總結：效能優化的正確順序

1. 先確保正確性

2. 測量真實效能

3. 針對性優化

4. 驗證優化效果

相關連結與參考資源

尚未有邦友留言

標記使用者

Rust 逼我成為更好的工程師：從 Borrow Checker 看軟體設計系列第 22 篇