iT邦幫忙

2025 iThome 鐵人賽

DAY 8
0
生成式 AI

生成式AI的風起雲湧 - 從教育到企業落地應用 (過去‧現在‧未來)系列 第 8

Day 8|(現在篇) 生成式AI導入工廠資訊系統的第一步

  • 分享至 

  • xImage
  •  

一、為什麼工廠資訊系統要導入生成式AI?

我們常聽到「工業4.0」、「智慧工廠」,但這些名詞對一線工程師來說,往往只是壓力的代名詞。傳統的資訊系統早已建立多年,包含層級分明的 L1~L4 架構:

  • L1:感測層(PLC、感測器、機台資料)
  • L2:控制層(SCADA、HMI、EAP)
  • L3:管理層(MES、WMS)
  • L4:決策層(ERP、BI)

這些系統彼此串聯,但多半是為了「讓管理者看得到資料」,而不是「讓現場人員能快速找到解法」。而這正是生成式AI導入的第一個切入點。

生成式AI的優勢在於:能理解人類自然語言,快速統整多源資料,並以可讀方式回覆答案。當工廠導入這樣的能力,不再只是用 AI 預測數值、異常,而是讓它參與在「每日的問題解決流程中」,成為真正的「數位助理」。


二、資訊架構總覽:從 OT 到 IT 的資料旅程

🧠 架構總表

層級 系統代表 資料類型 傳輸方式
L1 PLC / Sensor 數值訊號、IO OPC-UA, MQTT
L2 SCADA / EAP 機台狀態、參數記錄 OPC, API
L3 MES / WMS 生產履歷、工單排程 DB / API
L4 ERP / BI 財務、KPI、庫存整合 ETL, API

在這樣的架構下,我們若想導入生成式AI系統,得先回答幾個關鍵問題:

  1. 哪一層級的資料對「問答」最有價值?
  2. 資料要怎麼處理,才讓 AI 能讀懂?
  3. 現場人員會怎麼問問題?他們想要的回答長怎樣?

三、生成式AI導入的第一步:找到“能用的資料”

📌 挑戰一:資料散落、不一致、難比對

  • 同一條產線的資訊可能分散在 3~4 個系統中。
  • 有些資料是 DB 結構化的,有些是報表PDF、Excel、圖檔、甚至是白板照片。
  • 同一個品號在 ERP、MES、機台端叫的名字可能都不一樣。

✅ 解法一:先建立 ETL 流程與對應表

  • 用腳本自動化資料萃取(E = Extract)
  • 資料清洗與欄位標準化(T = Transform)
  • 儲存為可搜尋的結構(L = Load)

我們可以先建立一份「關鍵詞/代碼對應表」:

{
  "CS11": "銅絞線機",
  "D1600A016": "製令單號對應軸號",
  "N2XL-2Y-1C-10": "產品料號",
  "銅耗": "每公里消耗重量",
  "StartUp": "開機紀錄"
}

這類資料字典不僅能幫助向量化時做文字標準化,也能成為 prompt engineering 的條件之一。


四、資料前處理與 chunk 切分:讓 AI 真懂你的資料

📌 挑戰二:資料太雜,AI 無法正確回應

很多人導入 RAG 系統後遇到第一個問題是:「為什麼 AI 回答都不準?」

多數問題出在資料前處理不良:

  • PDF 內容沒抽乾淨,格式亂跳
  • chunk 切得太大或太小,找不到上下文
  • 沒有 metadata,導致語意不完整

✅ 解法二:使用語義斷點斷句(semantic chunking)

以工廠常見的一份機台保養SOP來說,我們可以:

  • 每一段步驟為一 chunk(如:保養前、保養中、保養後)
  • 加入標籤 metadata(如:「WE27機台」、「月保養」、「責任人:班長」)
  • 使用向量化模型如 multilingual-e5-base 產出 embedding
chunk = {
  "content": "1. 關閉主電源 2. 確認無殘留壓力...",
  "metadata": {
    "machine": "WE27",
    "type": "月保養",
    "level": "班長"
  }
}

這樣做的好處是:在 Retrieval 階段可以根據 metadata 先篩選,再向量比對,大幅提升準確率。


五、踩過的坑:你會遇到的五個現場問題

1. ⛔ PDF 是掃描圖片不是文字

  • 解法1:加上 OCR 流程(PaddleOCR 或 Tesseract)
  • 解法2:加上 VLM 流程(llama3.2-vision)

2. ⛔ 太多工程師懶得寫操作紀錄

  • 解法:語音轉文字,整合語音紀錄進 GPT prompt

3. ⛔ metadata 沒標好,找不到上下文

  • 解法:自動標註工具(rule-based 或 LLM 自動摘要)

4. ⛔ 每台機台命名不一致

  • 解法:導入「知識標準化詞庫」並與 IT 同步維護

5. ⛔ 使用者不會問問題

  • 解法:提供 prompt 模板:「請用下列格式詢問:[機台編號]+[操作項目]+[時間段]

六、現場應用案例:從問題出發設計問答流程

假設一位產線人員想查詢:「上週 CS11 開機失敗的原因是什麼?」

設計流程如下:

  1. Prompt 解析

    • 機台 = CS11
    • 時間 = 上週
    • 事件 = 開機失敗
  2. RAG 查詢

    • 根據 metadata 過濾 chunk:「CS11」、「時間範圍為上週」、「事件為 StartUp = fail」
  3. GPT 回答

    • 「根據 2024/09/06 紀錄,CS11 開機失敗因油壓未達標準值(需 > 3.2 bar,實測 2.8),維修單已提交由 A002 號員工處理」

這樣的回答不只是找到資料,而是「理解需求後重新整理呈現」,才是真正的 AI 答案。


七、結語:導入 AI 的第一步,不是技術,而是問題本身

很多人誤會生成式 AI 導入就是「架個 GPT API」、「接個資料庫」就好,但其實第一步應該是:「你要解決什麼問題?

從這一年來我們實際在工廠做的經驗來看,導入生成式AI的黃金法則是:

先從一個固定、常見、具備文字紀錄的問題開始做起,再逐步擴展應用場景。

因為唯有從問題出發,才能決定你該抓什麼資料、怎麼清理、怎麼 chunk、怎麼回答,最後才是選什麼模型與技術。

這樣的導入路徑,才是真正能落地的 AI 工廠升級第一步。


📌 敬請期待:

Day 9|如何讓AI回答你工廠的專業問題(RAG介紹)


上一篇
Day 7|(過去篇) 回顧:過去一年我用 AI 做過哪些事
下一篇
Day 9|(現在篇) 如何讓 AI 回答你工廠的專業問題(RAG介紹)
系列文
生成式AI的風起雲湧 - 從教育到企業落地應用 (過去‧現在‧未來)9
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言