iT邦幫忙

2025 iThome 鐵人賽

DAY 8
0
AI & Data

AI 營養師 + Web3 數位健康護照系列 第 8

Day8. 從預訓練模型打造個人專屬 AI 營養顧問:使用 Hugging Face 模型(Pre-trained Models)

  • 分享至 

  • xImage
  •  

在理想狀態下,當然會想要像前幾天一樣,通通「自己來」——從零開始蒐集資料、設計模型,然後一步一步把它訓練到能用。但現實很骨感,這條路很容易把人榨乾(也會把時間跟錢錢都燒光QQ)。

自行訓練模型的挑戰

1. 成本真的太高

  • 語料需求數百 GB 起跳,還要多張 A100。
  • 雲端帳單常常讓人懷疑自己是不是不小心挖了比特幣。
  • 對中小團隊來說,這種投資很多時候「寫計畫書時很瀟灑,真的執行就欲哭無淚」。

2. 開發週期又長又痛苦

  • NLP 超吃資料品質,清理資料就能清到懷疑人生。
  • 超參數調整更像玄學,改一次學習率就像在算命。
  • 有時候跑了一晚,結果發現 accuracy 掉到谷底,當下只想躺在房間地板上反思人生:「我是不是選錯題目了?」

3. 維護也很累

  • 營養健康領域更新太快,新食材、新研究、飲食指南天天更新。
  • 模型如果不持續更新,很快就會失真。
  • 長期維護 = 長期燒錢與燒腦(頭髮很快就會掉光T_T)。

Hugging Face:AI 界的 GitHub

這時候 Hugging Face 的出現,真的就像耶穌復活一樣。它 2016 年成立,本來是個聊天機器人,後來一路轉型成開源 AI 平台,現在幾乎是 NLP 領域的「GitHub」。


技術流程:怎麼用?

1. 找模型

在 Hub 上搜「nutrition」「food」「health」之類的關鍵字,能找到不少模型。常見的應用:

  • 食材分類
  • 熱量/營養素預測
  • 飲食建議生成

2. 用 transformers 就能直接開箱:

from transformers import pipeline

classifier = pipeline("text-classification", model="your-chosen-model")
print(classifier("This meal contains chicken, rice, and broccoli."))

不用自己訓練,幾分鐘就能跑一個小實驗。

3. 微調

如果遇到模型不太懂在地食材(像芋頭、地瓜葉),就加一點資料做 fine-tune,就能更貼近台灣場景。這時候心情會很好,因為只需要幾百筆資料,而不是幾百 GB。

4. 部署

要快:丟 Spaces。
要穩:自己伺服器。
要佛系:就放在本地,等下次要 demo 的時候再打開。


好處在哪?

  1. :不用從零開始。
  2. :每次看到雲端帳單時,血壓不會再飆高。
  3. 社群資源:社群很活躍,踩過雷的人超多,少走很多冤枉路。

但是還是有缺點

  1. 資料來源疑慮:有些模型訓練資料來源不明,尤其在醫療、營養領域要特別小心。
  2. 客製化有限:如果需求差太多,還是得自己動手訓練。
  3. 平台依賴:萬一 Hugging Face 政策改版、模型下架,就得自己想辦法。

小結:

如果有無限資源,誰不想從零開始訓練模型。但「理想很美好,現實很殘酷」,相比之下,直接用 Hugging Face 的預訓練模型才是比較務實的選擇。

明天再來try Hugging Face的實際應用

Ref.


上一篇
Day7. 從零開始打造個人專屬 AI 營養顧問 Ep. 6:Google Colab 實作台灣夜市小吃的YOLO模型
系列文
AI 營養師 + Web3 數位健康護照8
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言