iT邦幫忙

2021 iThome 鐵人賽

DAY 24
0
AI & Data

從 AI 落地談 MLOps系列 第 24

Day 24 : 負責任的 AI - Responsible AI (RAI)

  • 當您用心呵護的機械學習終於實現,期待能滿足與提升使用者福祉,您應該有足夠的信心與能力對產品負責, AI 產品亦然。
  • 延續系列文對您的機械學習產品生命週期的思考,在資料驗證的任務可用 TFDV 視覺化、自動化檢視資料的狀況 (Day 14) ,在模型訓練完成可透過模型分析 TFMA 剖析模型在不同主題切片之下的預測成果 ( Day 23),現在與您分享驅動資料驗證與模型分析的核心思考 - 負責任的 AI (Responsible AI)。

什麼是 Responsible AI?

  • 人工智慧與您的機械學習系統是用以解決現實生活問題的,談論更有效的建構可以造福所有人的 AI 系統,即是 Responsible AI 的精神。

  • Responsible AI (RAI) 是現今對機械學習服務的深刻思考,認為各種組織在發展機械學習服務時,應重視服務對象的個體性與特殊性。鑒於資料集的偏斜可能導致預測結果偏頗,諸如升遷預測系統的資料集側重單一性別以致升遷選拔帶有性別定見,人臉生成系統未考慮種族多樣性以致偏向當一種族,您原本視為依據數據理所當然的產出也應考慮以人為本的公平性。再者,隨著隱私權的議題越見重視,歐盟一般資料保護法規 General Data Protection Regulation (GDPR) 揭示用戶有權請求被收集的資料,且有權在特定情況下刪除其資料。身為 AI 服務提供者,您如何在訓練情境中抽離個資議題去識別化,以及能在各個版本控制中刪除特定使用者的數據。面對 AI 服務攻擊的惡意,監測與回溯版本控制,解釋與理解模型現況,諸多議題匯聚為 Responsible AI 討論範疇,也成為實踐 AI 服務的顯學與課題,比起實踐的技術,衷於所有人福祉的服務更加重要。

  • 負責任的 AI 關注焦點引述 Google Responsible AI 說明,包含:

    • AI 最佳實踐 Recommended best practices for AI
      • 設計 AI 系統時應遵循軟體開發最佳做法,並且採用「以人為本」的方法運用機器學習技術。
    • 公平性 Fairness
      • 隨著 AI 對於各領域和社會的影響逐漸增加,建立「公平」且「可包容所有人」的系統至關重要。
    • 可解釋性 Interpretability
      • 我們必須「瞭解及信任」 AI 系統,才能確保系統能夠如預期般運作。
    • 隱私權 Privacy
      • 利用機密資料訓練模型時,需要「妥善保護隱私權」。
    • 安全性 Security
      • 「辨識潛在威脅」有助於維持 AI 系統安全。
  • 上述的「以人為本」、「公平」、「包容」、「瞭解及信任」、「妥善保護隱私權」、「辨識潛在威脅」串起您的機械學習系統實踐負責任的 AI 方針。

御三家的 Responsible AI 發展

  • Google

    • Google 在 2018 年推出了 AI 原則,之後,TensorFlow 等團隊依該原則發展產品,也推出 Responsible AI (RAI) 做法的工具和技巧,成為相當龐大的知識體系。
  • Azure

    • Azure 提出 Responsible ML,並且在文章中介紹諸多工具。
      • 在解讀和說明模型行為提出 InterpretML ,是由 Microsoft 所建置的開放原始碼解釋工具。
      • 減少不公平的工具為 FairLearn ,也是開放原始碼套件。
      • 實作差異隱私系統十分困難,開放原始碼專案 SmartNoise 可以協助完成任務。
  • AWS

    • 在 AWS Marketplace 有諸多第三方 Responsible AI 服務,諸如Dataiku 有相關功能,Amazon SageMaker Clarify也包含相對應功能,幫助您更能掌握模型。

機器學習工作流程中的 Responsible AI

  • 負責任的 AI 以機械學習服務生命週期各階段任務須注意事項,本篇延續Google 說明:
  • 1. 界定問題 Define problem
    • 我的機器學習系統是為誰而設計?

      使用者實際體驗系統的方式,對於評估機器學習系統預測、建議及決策的真實作用十分重要。請務必在開發過程中,儘早取得各類型使用者提出的意見。

    • 相關工具
  • 2. 建購及準備資料 Construct & prepare data
    • 我使用的資料集是否具有充分代表性?

      你的資料取樣方式是否可代表使用者 (例如:將用於所有年齡層,但你只有銀髮族的訓練資料) ,以及是否符合現實環境情況 (例如:將使用一整年,但你只有夏季的訓練資料)?

    • 我的資料中存在現實環境偏誤/人類認知偏誤嗎?

      資料中的潛在偏誤可能會形成複雜的回饋循環, 加深既有的刻板印象。

    • 相關工具
  • 3. 建購及訓練資料 Build & train model
  • 4. 評估模型 Evaluate model
  • 5. 部署及監控 Deploy & monitor
    • 是否存在複雜的回饋循環?

      即使整體系統設計經過悉心規劃, 以機器學習為基礎的模型在套用到 真實的動態資料時,很少能夠完美運作。當實際使用的產品發生問題時,請思考 該問題是否與任何弱勢族群議題相呼應,並考量 短期和長期解決方案對於該問題的影響。

    • 相關工具

PAIR : People + AI Research

  • People + AI (PAIR) 是一組使用 AI 進行設計的方法、最佳實踐和示例,建議閱讀,裡面包含您的模型服務如何設計的指引。譬如資料的呈現、按鈕的文案,增加使用者信任感的設計、如何有禮貌地拒絕與導引等,可以讓您的商業服務更順遂。
  • 譬如對解釋性-信任的解釋,提出 AI 服務取得用戶信任的主要因素:
    • 能力 是產品完成工作的能力,力求提供易於識別的有意義的價值的產品。
    • 可靠 表明您的產品如何始終如一地發揮其能力。根據用戶設定的期望,它是否符合品品質標準?僅當您能夠滿足您已設置並向用戶透明地描述的欄時才啟動。
    • 仁慈 是相信受信任方希望為用戶做好事的信念。用戶從他們與你的產品的關係中得到了什麼,你又從中得到了什麼?對此要誠實和坦率。
    • 上圖為 PAIR 實際舉例,可以改進您 AI 服務體驗,也有不少可以上您 AI 服務到位的建言。

小結

  • 一整理下來就頭昏了,您可以感受到近期隨著對 ML/DL 模型解釋力、公平性的需求,各家平台以及開源工具著墨甚多,也是近期人工智慧領域發展的核心,用系統性的從定義、資料、模型到佈署的負起建構 AI 服務應有的責任與使命,讓所有人都能有所裨益。
  • 其中不乏酷酷的東西,後續將會介紹 AI 解釋力與演示公平性的調整實作。

/images/emoticon/emoticon41.gif

參考


上一篇
Day 23 : 模型分析 TensorFlow Model Analysis (TFMA)
下一篇
Day 25 : 可解釋的 AI - Explain AI (XAI)
系列文
從 AI 落地談 MLOps30

尚未有邦友留言

立即登入留言