Day 8｜(現在篇) 生成式AI導入工廠資訊系統的第一步

2025 iThome 鐵人賽

DAY 8

生成式 AI

生成式AI的風起雲湧 - 從教育到企業落地應用 (過去‧現在‧未來)系列第 8 篇

17th鐵人賽

adamlivia

2025-09-22 12:24:56

152 瀏覽

分享至

一、為什麼工廠資訊系統要導入生成式AI？

我們常聽到「工業4.0」、「智慧工廠」，但這些名詞對一線工程師來說，往往只是壓力的代名詞。傳統的資訊系統早已建立多年，包含層級分明的 L1~L4 架構：

L1：感測層（PLC、感測器、機台資料）
L2：控制層（SCADA、HMI、EAP）
L3：管理層（MES、WMS）
L4：決策層（ERP、BI）

這些系統彼此串聯，但多半是為了「讓管理者看得到資料」，而不是「讓現場人員能快速找到解法」。而這正是生成式AI導入的第一個切入點。

生成式AI的優勢在於：能理解人類自然語言，快速統整多源資料，並以可讀方式回覆答案。當工廠導入這樣的能力，不再只是用 AI 預測數值、異常，而是讓它參與在「每日的問題解決流程中」，成為真正的「數位助理」。

二、資訊架構總覽：從 OT 到 IT 的資料旅程

🧠 架構總表

層級	系統代表	資料類型	傳輸方式
L1	PLC / Sensor	數值訊號、IO	OPC-UA, MQTT
L2	SCADA / EAP	機台狀態、參數記錄	OPC, API
L3	MES / WMS	生產履歷、工單排程	DB / API
L4	ERP / BI	財務、KPI、庫存整合	ETL, API

在這樣的架構下，我們若想導入生成式AI系統，得先回答幾個關鍵問題：

哪一層級的資料對「問答」最有價值？
資料要怎麼處理，才讓 AI 能讀懂？
現場人員會怎麼問問題？他們想要的回答長怎樣？

三、生成式AI導入的第一步：找到“能用的資料”

📌 挑戰一：資料散落、不一致、難比對

同一條產線的資訊可能分散在 3~4 個系統中。
有些資料是 DB 結構化的，有些是報表PDF、Excel、圖檔、甚至是白板照片。
同一個品號在 ERP、MES、機台端叫的名字可能都不一樣。

✅ 解法一：先建立 ETL 流程與對應表

用腳本自動化資料萃取（E = Extract）
資料清洗與欄位標準化（T = Transform）
儲存為可搜尋的結構（L = Load）

我們可以先建立一份「關鍵詞／代碼對應表」：

{
  "CS11": "銅絞線機",
  "D1600A016": "製令單號對應軸號",
  "N2XL-2Y-1C-10": "產品料號",
  "銅耗": "每公里消耗重量",
  "StartUp": "開機紀錄"
}

這類資料字典不僅能幫助向量化時做文字標準化，也能成為 prompt engineering 的條件之一。

四、資料前處理與 chunk 切分：讓 AI 真懂你的資料

📌 挑戰二：資料太雜，AI 無法正確回應

很多人導入 RAG 系統後遇到第一個問題是：「為什麼 AI 回答都不準？」

多數問題出在資料前處理不良：

PDF 內容沒抽乾淨，格式亂跳
chunk 切得太大或太小，找不到上下文
沒有 metadata，導致語意不完整

✅ 解法二：使用語義斷點斷句（semantic chunking）

以工廠常見的一份機台保養SOP來說，我們可以：

每一段步驟為一 chunk（如：保養前、保養中、保養後）
加入標籤 metadata（如：「WE27機台」、「月保養」、「責任人：班長」）
使用向量化模型如 multilingual-e5-base 產出 embedding

chunk = {
  "content": "1. 關閉主電源 2. 確認無殘留壓力...",
  "metadata": {
    "machine": "WE27",
    "type": "月保養",
    "level": "班長"
  }
}

這樣做的好處是：在 Retrieval 階段可以根據 metadata 先篩選，再向量比對，大幅提升準確率。

五、踩過的坑：你會遇到的五個現場問題

1. ⛔ PDF 是掃描圖片不是文字

解法1：加上 OCR 流程（PaddleOCR 或 Tesseract）
解法2：加上 VLM 流程（llama3.2-vision）

2. ⛔ 太多工程師懶得寫操作紀錄

解法：語音轉文字，整合語音紀錄進 GPT prompt

3. ⛔ metadata 沒標好，找不到上下文

解法：自動標註工具（rule-based 或 LLM 自動摘要）

4. ⛔ 每台機台命名不一致

解法：導入「知識標準化詞庫」並與 IT 同步維護

5. ⛔ 使用者不會問問題

解法：提供 prompt 模板：「請用下列格式詢問：[機台編號]+[操作項目]+[時間段]」

六、現場應用案例：從問題出發設計問答流程

假設一位產線人員想查詢：「上週 CS11 開機失敗的原因是什麼？」

設計流程如下：

Prompt 解析：
- 機台 = CS11
- 時間 = 上週
- 事件 = 開機失敗
RAG 查詢：
- 根據 metadata 過濾 chunk：「CS11」、「時間範圍為上週」、「事件為 StartUp = fail」
GPT 回答：
- 「根據 2024/09/06 紀錄，CS11 開機失敗因油壓未達標準值（需 > 3.2 bar，實測 2.8），維修單已提交由 A002 號員工處理」

這樣的回答不只是找到資料，而是「理解需求後重新整理呈現」，才是真正的 AI 答案。

七、結語：導入 AI 的第一步，不是技術，而是問題本身

很多人誤會生成式 AI 導入就是「架個 GPT API」、「接個資料庫」就好，但其實第一步應該是：「你要解決什麼問題？」

從這一年來我們實際在工廠做的經驗來看，導入生成式AI的黃金法則是：

先從一個固定、常見、具備文字紀錄的問題開始做起，再逐步擴展應用場景。

因為唯有從問題出發，才能決定你該抓什麼資料、怎麼清理、怎麼 chunk、怎麼回答，最後才是選什麼模型與技術。

這樣的導入路徑，才是真正能落地的 AI 工廠升級第一步。

📌 敬請期待：

Day 9｜如何讓AI回答你工廠的專業問題（RAG介紹）

Day 7｜(過去篇) 回顧：過去一年我用 AI 做過哪些事

Day 9｜(現在篇) 如何讓 AI 回答你工廠的專業問題（RAG介紹）

系列文

生成式AI的風起雲湧 - 從教育到企業落地應用 (過去‧現在‧未來) 共 10 篇

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19860 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

生成式AI的風起雲湧 - 從教育到企業落地應用 (過去‧現在‧未來)系列 第 8 篇