儘管這次鐵人賽的後半段遭遇了些許波折,但我依然信守承諾,將所有文章完整呈現。
這一次的專案,對我而言是個相當巨大的挑戰,從無到有,一步步摸索資料爬取、清理,到模型訓練,每一步都是一次學習。幸運的是,有了 AI 工具的輔助,這段漫長的旅程得以大幅加速。
開發出的 MVP 版本,雖然離商業化仍有一段距離,但其在實務上的潛力不容小覷。這套系統能讓產品與客服團隊即時掌握顧客的痛點,有效分析海量評論,並快速產出關鍵洞察,大幅節省了傳統上耗費在人工標註與分類上的人力成本。
當初的靈感來源,其實是來自於工作上的需求。面對應用程式商店那龐雜的評論資料,手動整理儀表板的過程效率極低。這讓我開始思考:是否能打造一套自動化系統,不僅能自動化流程,更能迅速提煉出有價值的洞察,將人力從繁瑣的勞務中解放出來。
非常感謝你完整閱讀這 30 篇文章,並親手實踐這個 AI 評論洞察系統!若你有任何讓這個系統更臻完善的建議,歡迎隨時留言交流!
完整文章列表:
【Day 0】前言
【Day 1】專案規劃準備
【Day 2】工具與環境設置
【Day 3】如何從 App Store / Google Play 爬取應用程式評論資料
【Day 4】App 評論爬蟲設計與實作(1/5)
【Day 5】App 評論爬蟲設計與實作(2/5)
【Day 6】App 評論爬蟲設計與實作(3/5)
【Day 7】App 評論爬蟲設計與實作(4/5)
【Day 8】App 評論爬蟲設計與實作(5/5)
【Day 9】原始資料格式解析與初步檢查
【Day 10】資料前處理
【Day 11】資料探索性分析與視覺化
【Day 12】資料標註規則與主題分類定義
【Day 13】資料標註:工具選擇與實作流程
【Day 14】標註品質控管與一致性檢查:為什麼資料標註不能馬虎?
【Day 15】利用大型語言模型(LLM)加速資料標註流程
【Day 16】訓練語言模型的選擇:為什麼我用 BERT?
【Day 17】使用 LLM 進行自動標註流程
【Day 18】BERT模型訓練實作流程
【Day 19】評估指標介紹與選擇
【Day 20】提升模型性能:超參數調校與優化
【Day 21】Hugging Face:不只是模型庫,更是 AI 開發生態系
【Day 22】模型上傳流程與部署後測試
【Day 23】Dashboard 初版設計與系統開發設計
【Day 24】系統開發設計與實作(1/4)
【Day 25】系統開發設計與實作(2/4)
【Day 26】系統開發設計與實作(3/4)
【Day 27】系統開發設計與實作(4/4)
【Day 28】系統使用者測試
【Day 29】系統部署上線