【Day 15】利用大型語言模型（LLM）加速資料標註流程

2025 iThome 鐵人賽

DAY 16

AI & Data

30 天打造 App 評論洞察系統：用 AI 讓產品團隊更懂用戶系列第 16 篇

17th鐵人賽

jackietung

2025-09-05 21:10:55

359 瀏覽

分享至

在前幾篇文章中，我們深入探討了資料標註的原則與品質控管。然而，傳統的機器學習方法往往需要龐大的人工標註量，這不僅耗時，也耗費大量人力成本。為了應對這個挑戰，我開始思考如何利用**大型語言模型（LLM）**來加速標註流程，實現半自動化標註，進而減少手動工作量。

這種方法的核心概念是：
讓 LLM 擔任「初級標註員」，先進行初步的批量標註，然後再由人工進行精確的審核與校正。我們把精力集中在處理複雜的訓練模型設計上。

提示詞設計範例

以下是一個設計範例，可以讓 LLM 針對顧客評論進行情緒分類：

提示詞內容

請將顧客評論分辨其情緒分類，並標記為「正面」、「中性」或「負面」。請同時說明您的分類理由。如果評論內容無法明確判定情緒，請將其歸類為「中性」。

#顧客評論
{review}

#回答格式
情緒分類: [正面/中性/負面]
理由: [簡述分類原因]

#限制條件
1. 每個評論僅能歸類為一種情緒分類。
2. 如果評論內容涉及多個不同面向，請綜合考量整段內容，並根據其主要情緒進行整體判斷。
3. 確保您的回答完整涵蓋所有顧客評論，並依照上述格式以繁體中文回答問題。