在理想狀態下,當然會想要像前幾天一樣,通通「自己來」——從零開始蒐集資料、設計模型,然後一步一步把它訓練到能用。但現實很骨感,這條路很容易把人榨乾(也會把時間跟錢錢都燒光QQ)。
這時候 Hugging Face 的出現,真的就像耶穌復活一樣。它 2016 年成立,本來是個聊天機器人,後來一路轉型成開源 AI 平台,現在幾乎是 NLP 領域的「GitHub」。
在 Hub 上搜「nutrition」「food」「health」之類的關鍵字,能找到不少模型。常見的應用:
from transformers import pipeline
classifier = pipeline("text-classification", model="your-chosen-model")
print(classifier("This meal contains chicken, rice, and broccoli."))
不用自己訓練,幾分鐘就能跑一個小實驗。
如果遇到模型不太懂在地食材(像芋頭、地瓜葉),就加一點資料做 fine-tune,就能更貼近台灣場景。這時候心情會很好,因為只需要幾百筆資料,而不是幾百 GB。
要快:丟 Spaces。
要穩:自己伺服器。
要佛系:就放在本地,等下次要 demo 的時候再打開。
如果有無限資源,誰不想從零開始訓練模型。但「理想很美好,現實很殘酷」,相比之下,直接用 Hugging Face 的預訓練模型才是比較務實的選擇。
明天再來try Hugging Face的實際應用
Ref.