iT邦幫忙

2025 iThome 鐵人賽

DAY 3
0
IT 管理

AI 時代,IT 職人養成系列 第 3

AI 時代,IT 職人養成 Day03:職人的新利器 AI (上):從模型到 Agent 代理程式

  • 分享至 

  • xImage
  •  

AI 來了...

AI 來了,這是一個不可規避的事實,AI 就像一匹潛力無窮的待馴服的良駒,能讓 AI 發揮到什麼程度、幫助 IT 人員多少、幫助企業多少,完全看騎在馬上的您:平常如何馴服她。

還記得 薛平貴 與 紅鬃烈馬 吧,普通人騎普通馬,紅鬃烈馬 這種厲害的馬則是要有厲害的人才馴服得了、才騎得動。不然,可是會摔得四腳朝天的...

所幸,AI 這匹良駒會惦量主人您的力氣,你跟她小打小鬧:問個早安、Hello 之類的,他也跟您 Hello 恭維您一番,這時您會覺得 AI 好像就是這樣而已;但如果您很認真學習、認真馴服,則 AI 則會變成超強的 紅鬃烈馬,目前在大家努力開發下,看起來她是潛力無窮。

💡 AI 是良駒,也是烈馬 —— 關鍵在於駕馭的人。

要馴服 AI ,得好好的了解她,AI 組件很多、容易混淆,網路社群上,有人比喻 模型 (Model) 是引擎;Agent (代理程式) 是組裝後的一部車;提示詞 (Prompt) 則像是 油門/方向盤;車上還有很多配件,AI 也有很多擴充功能...

👉 PS:引擎/車/方向盤/油門/配件...的比喻,是 GPT 幫我找的,GPT 說出處很多,一時也辨識不出誰是先這樣比喻的。「良駒/紅鬃烈馬」是本文自創的呼應比喻。

接下來這兩天,讓筆者先幫大家把一些基本知識打個基礎,不會講太理論的東西 (那些筆者也講不出來 😄 )。這些基本知識有利我們爾後運用 AI 。

AI 簡史

記得三十幾年前,筆者就聽過「人工智慧」了,學校有開這樣名稱的課。

AI 發展早期著重方法探索與基礎累積,近年因運算力、資料與模型架構的成熟而快速普及,出現大規模應用潮。

  • 早期發展:從符號主義到機器學習,AI 經歷多次寒冬與復甦;深度學習在 2012 年 ImageNet 突破後,進入快速累積期。
  • 關鍵轉折:運算力、資料量與模型架構三件事同時成熟,催生了「通用生成式 AI」的實用時代。

💡 AI 的歷史不是直線,而是一場「冬天與春天的輪替」。

近幾年生成式 AI 興起的:

  • 2020 年:OpenAI 發布 GPT-3,百億等級參數帶來更流暢的自然語言生成,引發產業對「大模型能力」的關注。
  • 2022 年底:ChatGPT 上線,對話式體驗突破門檻,AI 從專業工具走向全民使用,掀起企業「用 AI」的決策潮,這時候才開始有人注意到 AI 時代即將到臨。
  • 2023 年:GPT-4 與多模態能力落地,閱讀圖片、表格與長文的實用性提升,企業內部自動化與知識助理開始普及。
  • 2025 年 8 月:GPT-5 發表,以前的 AI 模型被比喻為高中生程度,而 GPT-5 則是被比喻為博士生程度
  • 這幾年:Claude、Llama、Gemini、GPT 等多家模型百家爭鳴,開源與商用雙軌發展,企業開始討論如何導入企業內應用,更有號稱 AI Native (AI 原生) 的企業。

產業趨勢:未來是「有使用 AI」vs「沒使用 AI」的競爭

如果把企業比作一支球隊,AI 就像體能與情報的加乘工具:不用不會馬上輸,但在拉長賽局後,落差會被幾何級放大。

  • 為何 AI 成為關鍵差異化?
    • 它同時影響「速度、品質、成本、體驗」四個面向,一次拉動多條 KPI。
    • 讓人力專注高價值環節,把重複性工作交給機器;流程從「人工驅動」轉為「人機協作」。

💡 企業競爭的本質:同樣的隊伍,有 AI 加持,跑得更快、更久。

AI 對產業影響甚鉅,這裡就不詳細展開,我們先把重心拉回來:IT 職人,因為在台灣中小企業,唯有先增進 IT 職人 AI 素養,才能更好的帶進到企業應用。

影響 AI 表現的四大關鍵

    1. 模型(Model):能力的「引擎」。
    1. 代理程式(Agent):把引擎裝上車、能跑業務的「整車」。
    1. 提示詞工程(Prompting):油門與方向盤 (下回談)。
    1. 擴充功能(Tools/Plugins/MCP):車上豐富的配件,增進汽車效能 (下回談)。

💡 AI 的力量,不在單點,而在組合。

關鍵一:AI 模型(Model)

AI 模型 (Model) 不是一個 APP,而是能理解、推理與生成的「能力本體」。

模型是什麼?

模型,是各家 AI 廠商費心訓練出來的,據筆者所知: AI 模型是遍覽群書,好像讀了古今中外的書、及 Internet 上所有公開的資料,這些加起來,其文字量相當於數千萬到上億本書。也就是說:在模型被訓練的截止日之前的書、Internet 公開資料,她都看過了。

模型也像是一個「知識怪獸」。想像一下,有人把世界各地的圖書館打包,再加上網路上公開的資料,全丟進它的腦袋裡。結果,它一口氣讀了數千萬、甚至上億本書。

不過,這個「怪獸」也有缺點:

  • 它的記憶是有「截止日期」的,就像有人在 2023 年畢業後,就再也沒讀過新書一樣。

  • 它雖然讀很多,但不代表每一行都能背得滾瓜爛熟;有時候它還會「張冠李戴」,一本正經的亂說。

💡 AI 模型像一個博學的朋友 —— 會聊天,但偶爾也會亂吹牛。

所以,跟 AI 模型相處,就像跟一個博覽群書、但偶爾會吹牛的朋友聊天 —— 有趣、聰明,但不能完全照單全收。

關於模型的四件事

對於我們使用 AI 的人來說,關心 AI 模型主要有四件事:

  1. 聰明程度(推理、工具使用、穩定性)
  2. 專長領域:有的專長於文字,有的則是 圖形,我們這裡先探討 文字處理專長的模型。
  3. 上下文窗口 (Context window):就是你一次可以塞給 AI 模型的資料量的大小,輸入、與輸出的 Context 大小,各模型各有不同。這種上下文窗口的大小,是以 token 為計量單位。

👉 概略是:英文 100 tokens ≈ 75 個英文單字;中文 100 tokens ≈ 100 個字,但不絕對。端視各家 AI 模型自己的計算而定。

  1. 費用問題
  • 計量制:各模型有制定 input / output 每百萬 tokens 的費用。
  • 方案制:各 AI 廠商有制定每月比如 USD20, USD100, USD200 的使用方案,這些方案也會跟你使用什麼模型與 tokens 有關。
  • 免費方案:各 AI 廠商為吸引大家使用,通常有免費方案,使用 tokens 數、或使用次數在某個數量以下免費,超過數量,她就叫您等幾個小時後再來用,或付費升級之。

💡 選模型不只是看聰明程度,而是看會不會「帳單爆表」 (帳單爆表可是會被 老闆 或 財務 約談的...)。

常見的主流模型

  • 主流的通用型模型系列:
    • GPT 系列(廠商:OpenAI):綜合表現強、工具使用與推理力突出,商務生產力場景滲透度高。
    • Claude(廠商:Anthropic):對齊與安全性著稱,長文本處理穩定,適合政策/法遵/長文件理解。
    • Gemini(廠商:Google):多模態與搜尋優勢,適合需要影像/表格/程式碼並用的場景。
    • Llama(廠商:Meta,開源):適合私有化、邊緣與成本敏感場景,自訂可控但需 MLOps 能力。

👉 如果要拿開源模型自己架設 AI ,通常需要昂貴的 GPU ,常見的是 NVIDIA H100 一張卡要價一百多萬台幣,通常需要兩張以上比較合適,還有 伺服器硬體...的費用。

👉 只是要玩一玩的話,Mac M4 Pro 128G 統一記憶體 的機器可以試一些小一點的模型,但 token 吐得很慢,還不是很實用。

👉 通常需要 GPU 記憶體 80G 以上,也有小一點的模型,GPU 32G 記憶體就可以開始跑。

  • 各主流廠商模型 聰明程度模型名稱:
廠商 上(高階) 中(主力/旗艦/均衡) 下(輕量/高效)
OpenAI (GPT) GPT-5 thinking GPT-5 GPT-5-mini, GPT-5-nano
Anthropic (Claude) Claude 4.1 Opus Claude 4 Sonnet Claude 4 Haiku
Google (Gemini) (待查) Gemini 2.5 Pro Gemini 2.5 Flash / Flash‑Lite

💡 大多數情境,用「主力/旗艦」就夠用。 💬 ChatGPT 5 會依任務難度自動選模型,降低選擇負擔。

  • 除了以上「通用型模型」外,還有專門功能的模型,以 Google 家為例:Imagen 模型用於 圖像生成、Veo 用於 影片生成、Lyria 用於 音樂生成...。最近很熱門的 Nano Banana 則是 Gemini 2.5 Flash Image 模型。

怎麼選?

很多人會問:「模型這麼多,我到底該用哪一個?」
其實,選模型就像選車,不是看誰最貴、誰馬力最大,而是看你要拿來做什麼。

1. 依需求匹配

  • 長文匯整 / 政策檢核 → 選 Claude / Gemini,就像請一位耐心細讀公文的秘書。
  • 日常辦公 / 自動化 → 選 GPT 系列,它像一個萬用的助理,寫文件、寫程式、腦力激盪都能勝任。
  • 私有化 / 成本控管 → 選 Llama 等開源模型,這比較像自己組裝一台車:便宜、可客製,但維修得靠自己。

👉 重點不是「最強」,而是「最合拍」。

💡 模型選型,不是比誰大,而是比誰懂你。

2. 評估維度

挑模型時,可以問自己這幾個問題:

  • 穩不穩定?(會不會常常答非所問)
  • 會不會用工具?(能不能幫我接資料庫、翻文件、調 API)
  • 能不能多模態?(文字、圖片、表格一起處理)
  • 延遲與成本?(速度能接受嗎?會不會一跑帳單就爆炸)
  • 合不合規?(有沒有資料外洩的風險)

👉 這幾個問題,比「參數大小」重要得多。就像買車時,你會問油耗、維修、保固,而不是只看馬力。

3. 避雷提醒

不要被「最強模型」的廣告詞帶著走。再強的車,開在你家巷子裡,也開不快。模型選型,重點是 「合適」與「跟你合作的默契」,而不是選最貴。

4. 新手建議

一開始,其實不用太糾結。先從 ChatGPT 開始,等你真的踩過油門、轉過方向盤,再去比較 Claude、Gemini、Llama,就會知道自己和哪一台車最適合您。

關鍵二:AI 代理程式(Agent)

有了引擎,還需要變成能辦事的「車」。AI 代理程式(Agent)不是指一個品牌,而是一種系統設計:讓模型能看資料、用工具、記住上下文、分步完成任務。

這個 AI 代理程式是一個人機介面,人是跟 Agent 互動,再由 Agent 與後端的 模型 溝通。這些關係要講清楚,可能得畫一張圖,今天的資料已經有點多了。這部分就明天繼續囉......

小結

今天我們先談了 AI 模型(Model)。它就像一匹潛力無窮的良駒,或者是一顆強大的引擎 —— 決定了能跑多快、多穩、多省油。模型是基礎,但光有這顆引擎,還不足以真正幫 IT 職人衝鋒陷陣。

真正能派上用場的,是 AI 代理程式(Agent)。它就像一輛能上路的整車:不只裝上引擎,還能握住方向盤、踩下油門、幫你帶上工具箱,甚至能記住上次你跑到哪裡。

明天我們就來看看,這些 AI 代理程式如何讓 IT 職人不只是駕駛,而能升級成一支 人機協作的專業隊伍。這會是未來 IT 人真正的核心戰力。

💡 AI 模型是力量的來源,Agent 才是讓力量落地的關鍵。


上一篇
AI 時代,IT 職人養成 Day02:一個人對抗 35 人的 IT Support 工程師日常
下一篇
AI 時代,IT 職人養成 Day04:職人的新利器 AI(中):從 Agent 代理程式到提示工程
系列文
AI 時代,IT 職人養成9
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言