iT邦幫忙

2025 iThome 鐵人賽

DAY 13
0
AI & Data

30 天打造 App 評論洞察系統:用 AI 讓產品團隊更懂用戶系列 第 13

【Day 12】資料標註規則與主題分類定義

  • 分享至 

  • xImage
  •  

資料標註(Data Annotation)在情感分析中的重要性

在進行情感分析模型訓練之前,資料標註(Data Annotation) 是一個非常關鍵的步驟。透過標註,模型才能夠理解資料所對應的情緒與主題,進而學習如何進行自動化分類。

在本次專案中,我們進行了兩種標註:

  • 情緒分類標註
  • 主題分類標註

1. 情緒分類標註

情緒分類標註的目標是判斷使用者在評論中所表達的情感傾向。這類分類通常較直觀,比較容易判斷,例如:

  • 正面:表達滿意、推薦、稱讚等情緒
  • 負面:抱怨、批評、失望等情緒
  • 中性:沒有明顯正負傾向,例如描述事實或單純提出問題

2. 主題分類標註

除了情緒之外,如果只知道「顧客是滿意或不滿意」往往不夠,因為我們還需要理解「他們滿意或不滿意的原因」。這就涉及到主題分類標註

在主題分類中,可以根據不同產業特性來設計標註的分類架構。以 電商產業 為例,消費者的購買行為大致可以拆解為以下幾個面向:

  1. 帳號與認證

    • 註冊、登入、帳號安全等相關問題
  2. 商品搜尋與瀏覽

    • 搜尋體驗、篩選功能、分類瀏覽
  3. 商品資訊與庫存

    • 商品描述、價格、規格、評價、庫存狀態
  4. 購物車與結帳

    • 加入購物車、付款流程、訂單生成
  5. 售後服務與會員權益

    • 訂單追蹤、客服服務、退換貨流程、會員優惠
  6. 其他/特殊問題

    • 系統異常、模糊情境或跨領域問題

透過這樣的主題分類,模型不僅能判斷評論是「正面或負面」,還能辨識顧客所反映的問題屬於哪個流程環節。


範例

  • 「APP 一直登入失敗」
    主題:帳號與認證
    情緒:負面

  • 「商品圖片很清楚,價格也合理」
    主題:商品資訊與庫存
    情緒:正面

  • 「配送速度很快,但包裝有破損」
    主題:售後服務與會員權益
    情緒:中性偏負面


結語

資料標註的設計會直接影響到模型的輸出價值。透過「情緒分類」與「主題分類」的結合,我們不僅能分析 「顧客開心或不開心」,還能回答 「顧客為什麼會開心或不開心」,進而把資料真正轉化為對業務決策有幫助的洞察。


上一篇
【Day 11】資料探索性分析與視覺化
系列文
30 天打造 App 評論洞察系統:用 AI 讓產品團隊更懂用戶13
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言