音界咒零．二版再遇剖析（一）調車場算法

2024 iThome 鐵人賽

DAY 27

Software Development

離塵指引．卷之一．試結丹：程式語言自舉系列第 27 篇

16th鐵人賽

mros

團隊天堂製造

2024-10-11 23:57:57

343 瀏覽

分享至

零・二版新增了「若」、「術」兩語句，並增加了比較、餘數運算子。

運算子優先級語法定義

零・一版的算式語法如下：

算式      = 乘除式・(＋・乘除式)*
         | 乘除式・(－・乘除式)*

乘除式    = 原子式・(＊・原子式)*
         | 原子式・(／・原子式)*

原子式    = 數字
         | 變數
         | "（"・算式・"）"

為了區分乘除與加減以及括號的優先級，吾人生造了乘除式與原子式以讓剖析器自動以正確層級構造算式。

新增的比較、餘數運算子也可依照此法，再切分出更多運算子的語法：

算式      = 加減式・(＝＝・加減式)*
         | 加減式・(！＝・加減式)*
         | 加減式・(＞＝・加減式)*
         | 加減式・(＞・加減式)*
         | 加減式・(＜＝・加減式)*
         | 加減式・(＜・加減式)*

加減式    = 餘數式・(＋・餘數式)*
         | 餘數式・(－・餘數式)*

餘數式    = 乘除式・(％・乘除式)*

乘除式    = 原子式・(＊・原子式)*
         | 原子式・(／・原子式)*

原子式    = 數字
         | 變數
         | "（"・算式・"）"

以此語法手寫遞迴下降自然可以剖析算式，但仔細一想，在回溯過程中，算式能展開的方式越多種，就越常需要回到過去重試，當運算子種類越來越多，就有可能拖累到剖析器的效能。

而手寫遞迴下降中充斥大量為了處理優先級而生的函數，也會降低可讀性。那有沒有其他方法能決定優先級呢？

決定優先級的算法

道友們可能在煉氣時就學過或自己想到過該如何巧用棧，從左到右掃過一個算式就能求其值。該算法名為調車場算法，而其遞迴版本（遞迴跟棧關係密切啊！）有另一個名字，叫優先級爬升算法。

算法並不難，首先來觀察一個算式

1 == 5 - 3 % 2 * 4 - 1

從左到右來讀取，當讀取到

1 == 5

時，能確定 1 與 5 以 == 結合嗎？不能，若 5 的右側算子優先級比 == 還大，那 == 不會結合。

再來往右讀取 - 3

1 == 5 - 3

時，能確定 5 與 3 以 - 結合嗎？不能，若 3 的右側算子優先級比 - 還大，那 - 不會結合。

同理，一直向右讀取到

1 == 5 - 3 % 2 * 4

時，都無法確定任何一個算子結合，注意到，無法結合是因為，至今遇到的所有算子中右側總是比左側優先級高，故始終無法結合。（發現維護的序列具有單調特徵時，往往意味能用棧來解題。）

但再往右讀取一個算子就不一樣了

1 == 5 - 3 % 2 * 4 - 1

- 的優先級小於 2 * 4 ，故 2 * 4 必先結合。結合後密不可分，僅以代數 x 表示，可視為

1 == 5 - 3 % x - 1

- 比較的對象變為 % ，% 仍比 - 優先級高，故 3 % x 先結合，現在式子為

1 == 5 - x - 1

x 兩側的 - 優先級相等，但 - 是左結合，優先往左側結合，故 5 - x 先結合

1 == x - 1

此時 - 的優先級大於 == ，如果右側還有算子的話，倒是無法確定 x - 1 會結合，但現在右側已經沒東西了，故 x - 1 結合，最後輪到 == 。

用虛擬碼來表述該過程：

想像吾人先蓋住整個算式，再從左到右慢慢展露整個算式。

持續向右讀取新算子：
    將新算子與已知算式最右側的算子做比較
    若新算子優先級較低：
        則最右側已知算子可結合，此時再與結合後算式中的最右側算子比較。
        重複此動作直到已知算子優先級低於新算子，此時沒有一個算子的優先級能確認，將新算子丟回已知算式
    若新算子優先級較高：
        沒有一個算子的優先級能確認，將新算子丟進已知算式

當算子讀取完畢，從右往左結合。

該算法稍作加強，也能處理括號，基本想法是每當遇到右括號時，就當做算子已經暫時讀取完畢，算子算式由右一直向左結合直到碰到左括號。

以棧實作：調車場算法

此過程能以棧輕易模擬，具體作法可參照下方源碼：

fn 優先級(運算子: &Ｏ運算子) -> u64 {
    match 運算子 {
        Ｏ運算子::乘 => 4,
        Ｏ運算子::除 => 4,

        Ｏ運算子::餘 => 3,

        Ｏ運算子::加 => 2,
        Ｏ運算子::減 => 2,

        Ｏ運算子::等於 => 1,
        Ｏ運算子::異於 => 1,
        Ｏ運算子::小於 => 1,
        Ｏ運算子::小於等於 => 1,
        Ｏ運算子::大於 => 1,
        Ｏ運算子::大於等於 => 1,
    }
}

struct 調車場 {
    算元棧: VecDeque<Ｏ算式>,
    算子棧: VecDeque<Ｏ運算子>,
}

impl 調車場 {
    fn new(首個算元: Ｏ算式) -> Self {
        Self {
            算元棧: vec![首個算元].into(),
            算子棧: vec![].into(),
        }
    }
    fn 結合棧中算子(&mut self) {
        let 右算元 = self.算元棧.pop_back().unwrap();
        let 左算元 = self.算元棧.pop_back().unwrap();
        let 運算子 = self.算子棧.pop_back().unwrap();
        self.算元棧.push_back(Ｏ算式::二元運算(Ｏ二元運算 {
            運算子,
            左: Box::new(左算元),
            右: Box::new(右算元),
        }));
    }
    fn 讀取(&mut self, 新算子: Ｏ運算子, 新算元: Ｏ算式) {
        // 讀取到新算子，進行棧操作
        while !self.算子棧.is_empty() && 優先級(self.算子棧.back().unwrap()) >= 優先級(&新算子)
        {
            // 新算子優先級較低，代表棧中的算子算元可以先結合了。
            self.結合棧中算子();
        }
        // 棧中能結合的算子跟算元都結合了，推入新算子跟算元
        self.算子棧.push_back(新算子);
        self.算元棧.push_back(新算元);
    }

    fn 結束(&mut self) -> Ｏ算式 {
        while !self.算子棧.is_empty() {
            self.結合棧中算子();
        }
        assert_eq!(self.算子棧.len(), 0);
        assert_eq!(self.算元棧.len(), 1);

        self.算元棧.pop_back().unwrap()
    }
}

遞迴實作：優先級爬升算法

TODO:

混用回溯剖析與優先級決定算法

那吾人不妨在剖析器中將算子、算元與括號順序保留，再由此優先級爬升算法來處理優先級。

算式      = 原子式・(算子・原子式)*

原子式    = 數字
         | 變數
         | "（"・算式・"）"

由於括號已經由原子式處理，在剖析算式中不需要處理括號，應用前述的調車場算法即可。

fn 剖析算式(&self, 游標: usize) -> Option<(Ｏ算式, usize)> {
    let (原子式, mut 游標) = self.剖析原子式(游標)?;

    let mut 調車場 = 調車場::new(原子式);

    while let Some((新算子, 新游標)) = self.消耗運算子(游標) {
        let (新算元, 新游標) = self.剖析原子式(新游標)?;

        調車場.讀取(新算子, 新算元);

        游標 = 新游標
    }

    Some((調車場.結束(), 游標))
}