為什麼要討論?
現實世界有成本、延遲、隱私。不是每題都值得用最大支。
白話定義
Scaling Law:資料/參數/算力↑ → 效能多半↑,但有報酬遞減
小模型價值:便宜、快、可自管;任務窄時表現不差
常見情境
客服 FAQ、表單生成:小模型+好流程=夠用
多領域/長推理:大模型更穩,但要算錢
常見誤解
「大=萬能」→ 錯在限制沒搞清楚
「小=不行」→ 多數是資料與流程沒設好
如何判斷(觀念)
三問:
我在意的是一致性/正確性/速度哪個?
我能付出的每次推理成本是多少?
有沒有資料出界/合規的顧慮?
小結
選型不是選「最強」,是選「對我這題最划算」。