[Day 12] Error analysis — 錯誤中學會成長 (咩噗)

13th鐵人賽 mlops machine learning

chihying

2021-09-27 20:29:00

3144 瀏覽

分享至

To me, error analysis is the sweet spot for improvement. — Donald A. Norman

前言

實務上，我們常常會發現模型的準確率並不會在所有資料的子集都相同，它可能在某個輸入條件之下更常犯錯，而這樣的情況會導致模型不可靠，讓我們無法信任其決策結果。
雖然現存的模型評估方法存在許多漏洞，但其中最顯而易見的就是使用單個指標來評估模型，畢竟用一個數字就概括整個模型的行為是很偏頗的，而錯誤分析可以讓我們逃離單個準確率指標的窠臼，揭開隱藏在底下的錯誤分布情形，進而提升糾錯、改善模型的效率。

*圖片來源：Besmira Nushi — Responsible Machine Learning with Error Analysis

錯誤分析 (Error analysis)

錯誤分析是模型研發的核心流程，如果做的好，它可以告訴你如何最有效率的改善模型表現。
出乎意料的是，目前大部分的錯誤分析都是簡單粗暴的利用試算表手動作業，以語音辨識為例：
error spreadsheet
其分析步驟如下：

列出數個在驗證集中被預測錯誤的樣本 (包含標籤與預測值)。
對這些樣本可能擁有的屬性進行假設 (稱為 tag)，例如背景有車聲、人聲。
將預測錯誤的樣本依照上一步的 tag 進行分類 (樣本可同時擁有多種屬性)。
在過程中可隨時加入新的 tag，例如低頻寬，但要記得回頭檢視先前的樣本是否屬於此類別。

錯誤分析也是迭代的過程，可以不斷增加新的假設並重新分析：
error analysis iteration
這個過程可以幫助我們了解這些假設是否為錯誤的來源，以及是否需要進一步處理。
而不斷想出新的假設並分析更多資料，就是為了找出能最有效提昇模型表現的 tag，例如前面以 HLP 判斷改善背景有車聲的資料最能提昇模型表現。