2024 當今 AI 生態全景圖：主流 AI 的剖析與評論

16th鐵人賽

Ray 貓

2024-09-06 17:09:52

491 瀏覽

分享至

2024 當今 AI 生態全景圖：主流 AI 的剖析與評論

2024 年，AI 正處於群雄並起的戰國時代，各大科技公司紛紛推出自家的大型語言模型（LLM），不斷拓展其應用範圍。

在這篇文章中，我們將深入探討幾家主流公司（當前最知名的御三家：OpenAI、Anthropic、Google）的 AI 生態系統，並介紹他們最新推出的模型，如 GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro，以及一些代表性的開源模型，如 LLaMA 和 Mistral AI。

每個模型在特定領域都有其獨特的優勢與不足。根據你的需求，選擇最具性價比的模型。

另外大模型的發展速度日新月異，可能我發完這篇文章的隔天，就會有一個強大且超級便宜的模型橫空出世。
所以建議隨時追蹤最新的新聞（如果不知道追蹤什麼，可以從 OpenAI、Anthropic、Google 這三大家新聞來關注）。

如何比較這些模型？

為了讓大家更容易理解，我根據個人使用經驗，對每個模型進行了評分，並分成六大類別：

回應速度
程式精確度
中文語言表現（評估 AI 在中文修辭和用語流暢度上的表現）
理解能力（這指的是 AI 在提示不詳細時的表現，理解能力越好，AI 在簡單指令下也能表現優異）
成本
綜合評分（性價比）

請注意，這些評分都是基於個人主觀經驗，歡迎大家分享自己的使用心得。

LLM 是如何計價的？

LLM 通常是基於 token 來計價的。你可以簡單地將 token 理解為單詞，比如 “I like cats” 這句話會被拆分成 “I”， “like”，和 “cats” 三個 token。

較長且不常見的單詞，如 "javascript"，可能會占用兩個 token（“java”、“script”）。中文字則可以更簡單地理解為一個字就是一個 token。模型會根據你輸入了多少 token 以及它輸出了多少 token 來計價。

另外，假如你今天傳送了很多歷史對話給 AI，這些文字也會算入輸入 token 的範圍內。

OpenAI – GPT-4o 和 GPT-4o Mini

OpenAI 毫無疑問是目前最知名的 AI 公司，比較常被使用的模型有二

GPT-4o
被人稱為現代最強的~~五條悟~~模型
強大、快速、聰明，但也昂貴
咱們就把他當作衡量其他模型的戰力單位吧
評分：
- 回應速度：8 分
- 程式精確度：8 分
- 中文語言表現：8 分
- 理解能力：8 分
  成本：
- 輸入 $2.50 / 100 萬 token
- 輸出 $10.00 / 100 萬 token
  綜合評分：8 分
GPT-4o Mini
小而強大，且成本低得驚人，適合非專業的常見應用。
評分：
- 回應速度：9 分
- 程式精確度：7 分
- 中文語言表現：7 分
- 理解能力：6 分
  成本：
- 輸入 $0.15 / 100 萬 token
- 輸出 $0.60 / 100 萬 token
  綜合評分：9 分（耐不住他便宜， CP 值高）

Anthropic – Claude 3.5 Sonnet 和 Claude 3 Haiku

Anthropic 是我認為唯一能與 OpenAI 打得有來有回的公司，我非常看好它的未來發展。
當前主流的模型有三個：

Claude 3.5 Sonnet
對標 GPT-4o
但具備輸入更多 token 的能力。
評分：
- 回應速度：8 分
- 程式精確度：9 分
- 中文語言表現：8 分
- 理解能力：8 分
  成本：
- 輸入 $3.00 / 100 萬 token
- 輸出 $15.00 / 100 萬 token
  綜合評分：8 分
Claude 3 Haiku
速度快、聰明且價格親民，不過也算上一代的就模型了，曾經也是高 CP 值的選擇
評分：
- 回應速度：8 分
- 程式精確度：6 分
- 中文語言表現：7 分
- 理解能力：6 分
  成本：
- 輸入 $0.25 / 100 萬 token
- 輸出 $1.25 / 100 萬 token
  綜合評分：7 分
Claude 3 Opus
已經過時的產品，不建議使用。
評分：
- 回應速度：3 分
- 程式精確度：8 分
- 中文語言表現：8 分
- 理解能力：8 分
  成本：
- 輸入 $15 / 100 萬 token
- 輸出 $75 / 100 萬 token
  綜合評分：1 分（又貴又慢）

Google – Gemini 1.5 Pro 和 Gemini 1.5 Flash

Google 的 Gemini 系列主打多模態處理，特別是在文本與圖像結合的應用上表現出色。這使得它成為處理需要多種媒體的項目的理想選擇。

Gemini 1.5 Pro
個人使用感覺，在純文本生成和程式碼生成方面，表現不如 GPT-4o 或 Claude 3.5 Sonnet。
而且 Google 對惡意字詞偵測特別奇怪，我之前只是說了臭豆腐三個字
就被認為是惡意對話，整個 API 直接炸掉
回答速度　　　8 分
程式碼精確度　8 分
中文造詣能力　6 分
通靈能力　　　7 分
成本
- 輸入 $3.50 / 1百萬 token
- 輸出 $10.50 / 1百萬 token
綜合評分　　　5 分
Gemini 1.5 Flash
Gemini 的輕量版，專為小規模的文本生成和視覺處理設計。
它的處理速度快，並且成本超級低廉，甚至只有 GPT-4o-mini 的一半，非常適合輕量級應用或快速原型設計。
回答速度　　　9 分
程式碼精確度　6 分
中文造詣能力　6 分
通靈能力　　　5 分
成本
- 輸入 $0.075 / 1百萬 token
- 輸出 $0.3 / 1百萬 token
綜合評分　　　8 分（耐不住他真的很便宜）