iT邦幫忙

2024 iThome 鐵人賽

DAY 27
0
Software Development

離塵指引.卷之一.試結丹:程式語言自舉系列 第 27

音界咒零.二版再遇剖析(一)調車場算法

  • 分享至 

  • xImage
  •  

零・二版新增了「若」、「術」兩語句,並增加了比較、餘數運算子。

運算子優先級語法定義

零・一版的算式語法如下:

算式      = 乘除式・(+・乘除式)*
         | 乘除式・(-・乘除式)*

乘除式    = 原子式・(*・原子式)*
         | 原子式・(/・原子式)*

原子式    = 數字
         | 變數
         | "("・算式・")"

為了區分乘除加減以及括號的優先級,吾人生造了乘除式原子式以讓剖析器自動以正確層級構造算式。

新增的比較、餘數運算子也可依照此法,再切分出更多運算子的語法:

算式      = 加減式・(==・加減式)*
         | 加減式・(!=・加減式)*
         | 加減式・(>=・加減式)*
         | 加減式・(>・加減式)*
         | 加減式・(<=・加減式)*
         | 加減式・(<・加減式)*

加減式    = 餘數式・(+・餘數式)*
         | 餘數式・(-・餘數式)*

餘數式    = 乘除式・(%・乘除式)*

乘除式    = 原子式・(*・原子式)*
         | 原子式・(/・原子式)*

原子式    = 數字
         | 變數
         | "("・算式・")"

以此語法手寫遞迴下降自然可以剖析算式,但仔細一想,在回溯過程中,算式能展開的方式越多種,就越常需要回到過去重試,當運算子種類越來越多,就有可能拖累到剖析器的效能。

而手寫遞迴下降中充斥大量為了處理優先級而生的函數,也會降低可讀性。那有沒有其他方法能決定優先級呢?

決定優先級的算法

道友們可能在煉氣時就學過或自己想到過該如何巧用棧,從左到右掃過一個算式就能求其值。該算法名為調車場算法,而其遞迴版本(遞迴跟棧關係密切啊!)有另一個名字,叫優先級爬升算法

算法並不難,首先來觀察一個算式

1 == 5 - 3 % 2 * 4 - 1

從左到右來讀取,當讀取到

1 == 5

時,能確定 1 與 5 以 == 結合嗎?不能,若 5 的右側算子優先級比 == 還大,那 == 不會結合。

再來往右讀取 - 3

1 == 5 - 3

時,能確定 5 與 3 以 - 結合嗎?不能,若 3 的右側算子優先級比 - 還大,那 - 不會結合。

同理,一直向右讀取到

1 == 5 - 3 % 2 * 4

時,都無法確定任何一個算子結合,注意到,無法結合是因為,至今遇到的所有算子中右側總是比左側優先級高,故始終無法結合。(發現維護的序列具有單調特徵時,往往意味能用棧來解題。)

但再往右讀取一個算子就不一樣了

1 == 5 - 3 % 2 * 4 - 1

- 的優先級小於 2 * 4 ,故 2 * 4 必先結合。結合後密不可分,僅以代數 x 表示,可視為

1 == 5 - 3 % x - 1

- 比較的對象變為 % ,% 仍比 - 優先級高,故 3 % x 先結合,現在式子為

1 == 5 - x - 1

x 兩側的 - 優先級相等,但 - 是左結合,優先往左側結合,故 5 - x 先結合

1 == x - 1

此時 - 的優先級大於 == ,如果右側還有算子的話,倒是無法確定 x - 1 會結合,但現在右側已經沒東西了,故 x - 1 結合,最後輪到 == 。

用虛擬碼來表述該過程:

想像吾人先蓋住整個算式,再從左到右慢慢展露整個算式。

持續向右讀取新算子:
    將新算子與已知算式最右側的算子做比較
    若新算子優先級較低:
        則最右側已知算子可結合,此時再與結合後算式中的最右側算子比較。
        重複此動作直到已知算子優先級低於新算子,此時沒有一個算子的優先級能確認,將新算子丟回已知算式
    若新算子優先級較高:
        沒有一個算子的優先級能確認,將新算子丟進已知算式

當算子讀取完畢,從右往左結合。

該算法稍作加強,也能處理括號,基本想法是每當遇到右括號時,就當做算子已經暫時讀取完畢,算子算式由右一直向左結合直到碰到左括號。

以棧實作:調車場算法

此過程能以棧輕易模擬,具體作法可參照下方源碼:

fn 優先級(運算子: &O運算子) -> u64 {
    match 運算子 {
        O運算子::乘 => 4,
        O運算子::除 => 4,

        O運算子::餘 => 3,

        O運算子::加 => 2,
        O運算子::減 => 2,

        O運算子::等於 => 1,
        O運算子::異於 => 1,
        O運算子::小於 => 1,
        O運算子::小於等於 => 1,
        O運算子::大於 => 1,
        O運算子::大於等於 => 1,
    }
}

struct 調車場 {
    算元棧: VecDeque<O算式>,
    算子棧: VecDeque<O運算子>,
}

impl 調車場 {
    fn new(首個算元: O算式) -> Self {
        Self {
            算元棧: vec![首個算元].into(),
            算子棧: vec![].into(),
        }
    }
    fn 結合棧中算子(&mut self) {
        let 右算元 = self.算元棧.pop_back().unwrap();
        let 左算元 = self.算元棧.pop_back().unwrap();
        let 運算子 = self.算子棧.pop_back().unwrap();
        self.算元棧.push_back(O算式::二元運算(O二元運算 {
            運算子,
            左: Box::new(左算元),
            右: Box::new(右算元),
        }));
    }
    fn 讀取(&mut self, 新算子: O運算子, 新算元: O算式) {
        // 讀取到新算子,進行棧操作
        while !self.算子棧.is_empty() && 優先級(self.算子棧.back().unwrap()) >= 優先級(&新算子)
        {
            // 新算子優先級較低,代表棧中的算子算元可以先結合了。
            self.結合棧中算子();
        }
        // 棧中能結合的算子跟算元都結合了,推入新算子跟算元
        self.算子棧.push_back(新算子);
        self.算元棧.push_back(新算元);
    }

    fn 結束(&mut self) -> O算式 {
        while !self.算子棧.is_empty() {
            self.結合棧中算子();
        }
        assert_eq!(self.算子棧.len(), 0);
        assert_eq!(self.算元棧.len(), 1);

        self.算元棧.pop_back().unwrap()
    }
}

遞迴實作:優先級爬升算法

TODO:

混用回溯剖析與優先級決定算法

那吾人不妨在剖析器中將算子、算元與括號順序保留,再由此優先級爬升算法來處理優先級。

算式      = 原子式・(算子・原子式)*

原子式    = 數字
         | 變數
         | "("・算式・")"

由於括號已經由原子式處理,在剖析算式中不需要處理括號,應用前述的調車場算法即可。

fn 剖析算式(&self, 游標: usize) -> Option<(O算式, usize)> {
    let (原子式, mut 游標) = self.剖析原子式(游標)?;

    let mut 調車場 = 調車場::new(原子式);

    while let Some((新算子, 新游標)) = self.消耗運算子(游標) {
        let (新算元, 新游標) = self.剖析原子式(新游標)?;

        調車場.讀取(新算子, 新算元);

        游標 = 新游標
    }

    Some((調車場.結束(), 游標))
}

上一篇
音界咒零.二版再遇分詞(二)視關鍵字為特殊識別子
下一篇
音界咒零.二版再遇剖析(二)組合子剖析器 (parser combinator)
系列文
離塵指引.卷之一.試結丹:程式語言自舉36
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言