iT邦幫忙

2025 iThome 鐵人賽

DAY 4
0
IT 管理

AI 時代,IT 職人養成系列 第 4

AI 時代,IT 職人養成 Day04:職人的新利器 AI(中):從 Agent 代理程式到提示工程

  • 分享至 

  • xImage
  •  

馴服 AI:從陌生到默契

能拉住 AI 這匹良駒韁繩的,需要先懂一些術語,才能更懂得「如何與 AI 合作」。今天,我們把鏡頭從模型本身,移到一台正在上路的車:整合了引擎(模型)的車身 (Agent),及如何握好方向盤與油門 (Prompt)。這些將決定了行車體驗好不好。😄

💡 懂術語,才握得住方向盤。

昨天我們說 AI 是一匹待馴服的良駒。有人問:「AI 真的能被馴服?」更貼切的說法是:當我們理解她的特性、建立互動默契後,它會變成可靠的夥伴。

以我撰寫這系列文章為例:第一天我幾乎是靠自己從頭到尾,AI 只在局部補資料;但到今天,AI 已能幫我做資料歸納、語句潤飾、甚至挑毛病。差別不在於 AI 變聰明,而是我們彼此的「合作方式」變更成熟。

補充一個基礎術語:昨天反覆提到的「模型」,正規名稱是 LLM(Large Language Model,大語言模型)。

💡 先馴服,再加速。

💡 模型是引擎,默契是油門。

AI 這一台車:引擎、車身與方向盤

我畫了一張圖用來說明 AI 核心元件間的彼此關係:

AI 核心元件關係圖

  • 引擎 -- 大語言模型在車的最前面,負責推動力與理解力。
  • 中間主體是一個 AI 代理程式:把所有東西整合成一台車,落地讓我們可以使用的 AI 工具。
  • 人,則透過 提示詞 (Prompt) 來驅動 AI 這一台車::你下達的自然語言指令,AI 便會依照你的意思回應您。
  • 另外還有一些外接配件(擴充能力、自訂指令/提示)就像行車紀錄器、導航、皮質座椅、杯架、音響...:不是每個人都有相同喜好與需要。

💡 工具很多,關鍵在於你怎麼用。

關鍵二:AI 代理程式(Agent)(續)

起初,我對「AI 代理程式」這名詞,很不清晰,因為接觸到很多簡體 Youtube 影片,都把 AI Agent 稱為 「AI 智能體」,而這些 AI 智能體往往只是 自訂提示;所以之前,我對 AI Agent 認識過於狹隘。

直到動手寫這系列,我才比較確定:Agent 是把模型、工具、記憶、規則、外部資源「整合起來」的人機介面與執行環境;它能依據你的任務,選擇用什麼工具、怎麼呼叫模型、如何把模型吐回來的東西再加工成最終的結果。

💡 模型給力,Agent 給結果

雖然 ChatGPT 是一個網頁,但它其實是很完整的 AI 代理程式 Agent:

  • 有系統層的行為規範(System Instructions)
  • 具備多模態能力(文字/圖像/語音)
  • 能外接工具(如瀏覽網站、檔案、程式執行)
  • 有對話記憶與自訂指令(Custom Instructions)

常見 AI Agent 類型

  • 通用型(General purpose Agent):比如:ChatGPT、Calude、Gemini...
  • SWE(Software Engineer) Agent:專門用在協助協程式的代理程式,比如:GitHub Copilot、Cursor、Codex CLI、Calude code、Gemini CLI...
  • 資料/分析 Agent:幫你整理 CSV、BI 報表、描述趨勢,像沉穩的資料分析師。
  • 客服/值班 Agent:接常見問答、歸檔、發回單,像 7x24 的值班助理。
  • 流程編排/協作 Agent:可分配子任務、序列化步驟、串連工具,比如 n8n。

💡 AI Agent 整合模型、工具、記憶、規則,讓 AI 落地給我們使用。

AI 代理程式結構

以常見的 AI Agent 來看,可以粗分為六個區塊:

  1. 系統提示(System Prompt/Instructions):
    樣子像「提示詞」,主要是規範 AI 代理程式的主要功能,什麼能做?什麼不能做?都常是寫死在 AI 代理程式裡面,但也有 AI 代理程式允許微調。它會規範 Agent 的角色與邊界,例如:不提供違規內容、回答要有步驟、語氣保持專業...。

  2. RAG(檢索增強生成):
    想像行李箱空間有限,得先把重點摺好再上車。LLM 大語言模型輸出入的 context window 有容量限制,RAG 負責「找資料 → 摘要/切塊 → 放進模型上下文」,讓模型在有限空間內看懂最多有效資訊。

  3. 工具程式(Tools/Functions):
    早期 AI Agent 幾乎沒外掛;現在常見的有檔案讀寫、網頁瀏覽、資料庫查詢、程式執行。方便,但也要注意安全:權限最小化、審計留痕、敏感資料脫敏,是中小企業導入時的三大原則。

    • 早期 AI 不能上網,但 AI 訓練有截止日,超過訓練截止日的問題,AI就回答不了。
    • 現在可以授權 AI 可以上網,就可以取得最新的資訊。

💡 會串工具的 Agent,才撐得起場景。

  1. 記憶(Memory):我們跟 AI 聊天,通常是這次的討論串,AI 會記得我們跟他再聊什麼,會有上下呼應的效果。但若是關掉重新再開,就是一個新的討論串 (thread) ,這時候 AI 就像記憶消失。

    • 要讓 AI 記住一些事,其實是可以跟他講:這個要記住。比如說:我是男生,你要記住喔。AI 以後就會知道你是男生囉。你也可以叫 AI 記住你的名字、生日...之類的。爾後 AI 聊天就會叫你的名字了。
    • AI 記住的東西,通常是存放在「設定檔」裏頭,只要知道「設定檔」在哪裡,也可以自己去添加、修改或刪除。
    • 對話中短期記憶像是暫存器;跨對話的長期記憶則常放在設定或檔案中。你可以明確指示「記住我的部門與偏好」,也可刪除或關閉某些記憶。
  2. 自訂指令/提示(Custom Commands/Prompts):方便我們操作 AI Agent、或是讓 AI 化身為另外一個樣子的 AI Agent。

  3. 擴充能力(Extensions)
    包含各式插件與第三方整合:比如可以串接公司內部系統:把 工單系統、NAS、日曆串上去。注意:別什麼都開,要注意安全性。

💡 這些先大概知道即可。

如何開始用 ChatGPT

步驟很簡單:

  1. 直接到 chatgpt.com 開始聊天;
  2. 若要保留紀錄,註冊帳號、再登入即可。
  3. 練習「一問一答 → 補充脈絡 → 指定格式」的節奏,讓它越懂你。

App 與同步:

  • ChatGPT 有 Windows App 可以安裝使用。
  • 手機與平板也有 APP 可以安裝
  • 桌面版與手機都登入後:聊天內容會互通、同步對話。
  • 公司環境可先用個人帳號試行,但留意資料界線:不上傳公司敏感資料。

新手技巧:可以先把原本要 Google 的東西丟給 ChatGPT,如果發現她給的內容太舊、或有問題,可以告訴他:「這好像不是最新的,您再找找」

選擇取捨

  • 目前大廠的 AI 代理程式,通常只能使用自己家的 大語言模型:
    • 比如 OpenAI 公司的 ChatGPT 只能使用自家的 GPT 模型,如:GPT-5、GPT-4...
  • 一些自己沒有 大語言模型的公司或代理程式,才比較會可以使用多家的模型。
  • 市場上主流供應商(以 2025 年觀察)各有風格:
    • OpenAI:通用能力與工具生態完整,開發者資源豐富。
    • Google:與搜尋/辦公系統整合強,多模態研發深。
    • Anthropic:偏好安全、守規範,長文理解與工具使用表現穩定。

關鍵三:提示詞 Prompt

提示詞,是我們讓 AI 幫我們工作的重要溝通媒介。社群上被引喻為 方向盤、油門,有就是說實際操控 AI 的地方。

💡 Prompt 清楚,結果就會清楚。

提示詞 寫得好不好,就攸關 AI 是否如我們期望的表現,所以有專門的「提示詞工程」的學科、專書...等等,很認真的在研究 提示詞。也有人會認真的收集「提示詞」,比如如何讓 AI 畫出自己的公仔的提示詞...等,網路上也有專門收集跟分享的平台。

💡 不要猜 AI;請指揮它。

台灣也有很多 AI 老師上課時,會提供一些很實用的 AI 提示詞。「提示詞」簡單講,就是好好的講人話,因為 AI 已經非常瞭解人如何說話。

好吧,這幾天大家文字看很多了,我們就來實際練習吧,請先打開 ChatGPT.com 網站。跟著輸入下面這些提示詞,感受一下:

1️⃣ 基本對話型

先練習跟 AI 對話

  • 「請跟我說一個 IT 工程師的冷笑話。」
  • 「幫我解釋什麼是 IP 位址,像是對 10 歲小孩說明。」
  • 「請用三句話,解釋什麼是雲端運算。」

💡 從一句話開始,把默契疊起來。

2️⃣ 工作協助型

應用在 IT 日常

  • 「請幫我寫一封郵件,內容是通知同事:伺服器今晚要停機更新。」
  • 「Windows 11 網路顯示『公用網路』,我要怎麼改成『私人網路』?」
  • 「給我一個 Linux 指令,可以同時顯示目前目錄的檔案大小與排序。」

3️⃣ 學習與練習型

把 AI 當成小老師

  • 「請用表格比較 HDD、SSD 的差異,包含:速度、價格、壽命。」
  • 「模擬考試:請給我 3 題 CompTIA A+ 的練習題,並在最後附上答案與解析。」
  • 「我剛學 Python,幫我寫一個簡單的程式,可以顯示『Hello IT World!』。」

💡 用 AI 省時間,把時間花在更值得的事。

提示詞設計的基本功

Google 有一份入門文件 《Prompting guide 101》,裡面把「如何寫出好的提示詞(Prompt)」整理得非常清楚,對新手來說是非常好的學習資源。以下是簡單摘要:

  • 原文網址Prompting guide 101 (PDF)

  • 字數長度

    • 研究發現,最佳的提示詞平均字數大約是 21 字
    • 但多數人實際上輸入給 AI 的提示詞往往不到 9 個字,導致 AI 難以理解需求,結果常常差強人意。
  • 好的提示詞要素:PTCF 框架

    1. P = Persona(人物角色)
      指定 AI 扮演什麼角色,像是「資深 IT 顧問」或「CompTIA A+ 講師」,這會影響 AI 的回答風格與專業程度。
    2. T = Task(任務)
      明確交代要做什麼,例如「請解釋 BIOS 和 UEFI 的差異,並用表格整理」。
    3. C = Context(情境、上下文)
      提供必要的背景資訊,例如「假設讀者是剛進公司的 IT 新手」;在 Google Gemini 中,甚至可以透過 @ 引用 Google Drive 文件,讓 AI 直接讀取內容。
    4. F = Format(格式)
      告訴 AI 要以什麼形式輸出,例如「用表格」、「三段落說明」、「條列清單」,必要時還能給範例。
  • 延伸資源

    • 推薦收聽 「保哥帶你聽 EP02」(中文解說,非常淺顯易懂):YouTube 連結
  • 實務心得

    • 筆者實際測試過,這個 PTCF 框架在 ChatGPT 其他 AI 上一樣很有效。
    • 對新手來說,只要掌握這四個要素,就能快速寫出更清楚、更有用的提示詞。

今日小結

今天我們探討了 AI 代理程式 Agent、提示詞( Prompt )。也進一步認識了 AI 代理程式的結構。

ChatGPT、Claude、Gemini 這些看似單純的對話介面,其實背後有著不簡單、而且完整的機制。

提示詞的部分,Google 《Prompting Guide 101》PTCF 框架:Persona、Task、Context、Format 非常實用。這四個要素,就像是寫好「駕駛指令」,能讓 AI 更清楚地執行任務。

昨天是「認識良駒」,今天是「學會牽馬上路」。今天不知不覺又寫了超多的內容,原本只打算分 (上)(下) 兩篇寫完的,現在變成了 (上)(中)(下),明天繼續吧...,這兩天寫作的確寫得滿累的,明天我應該可以輕鬆一點了...

激發 AI 的潛力,在於我們如何與它合作、如何駕馭。筆者先幫大家整理一下最基本的知識、術語、概念,您要要多花點心思在提示詞上,您會發現 AI 回應的品質會逐步提升,默契也會愈來愈好。加油!

💡 變 AI 專家之前,先成為清楚的提問者。


上一篇
AI 時代,IT 職人養成 Day03:職人的新利器 AI (上):從模型到 Agent 代理程式
下一篇
AI 時代,IT 職人養成 Day05:職人的新利器 AI(下)—擴充性、安全性與可靠性
系列文
AI 時代,IT 職人養成9
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言