【Day05】Claude 網路搜尋

2025 iThome 鐵人賽

DAY 5

IT 管理

17th鐵人賽 claude web search

1210 瀏覽

作為一個面向非工程師的系列內容，在撰寫這種工具文章的時候，目標就是希望能把每一個或大或小的功能給講清楚，讓大家能知道「有什麼功能」、「這功能有什麼用」、「什麼時候用&如何用這功能」

今天一樣來講一個看起來很小，但實際上也有很多眉眉角角的一個功能——網路資訊檢索

什麼樣的內容會需要網路資訊檢索？

不知道大家是否有用過 2022 年的 ChatGPT ？那個時候的 AI 都還沒有包含網路搜尋相關的功能，因此只要去問一些超過模型訓練資料時間點的資訊的時候，都只能得到 AI 在亂掰的回答。

語言模型的訓練資料具有時間截止點，沒辦法得知訓練完成後發生的事件或資訊。
因此，當使用者詢問任何最新消息、即時數據或需要驗證當前事實時，AI 必須透過外部網路工具來擷取最新資訊，才能確保回應的時效性和準確性，不然就會變成沒有依據的亂掰。

如下面的示意圖所示，基本上就是一個這樣的流程

使用者丟出問題：使用者提出需要即時或最新資訊的問題，例如「今天台北股市的收盤指數是多少？」或「2025年諾貝爾物理學獎得主是誰？」
AI 判斷要搜尋的關鍵字：AI 分析問題內容，提取關鍵資訊並構建有效的搜尋詞彙，例如將問題轉換為「台北股市收盤今日」或「Nobel Prize Physics 2025 winner」等搜尋關鍵字。
檢索工具搜尋：檢索工具接收 AI 提供的關鍵字，透過搜尋引擎在網路上尋找相關資訊，或直接擷取指定網址的網頁內容。
搜尋結果：網路內容以結構化的格式回傳，包含多個相關網頁的摘要、標題、來源網址和發布時間等資訊。
AI 整理搜尋結果：AI 分析並篩選搜尋結果中的關鍵資訊，評估資料來源的可信度，去除重複或不相關的內容，並整合多個來源的資訊。
給出回答：AI 根據整理後的資訊生成完整的回應，引用資料來源，並以符合使用者需求的格式呈現答案，確保資訊的準確性和時效性。

上面看到的是一般的 AI 是如何透過外部的網路能力，來回答使用者提出的問題的。那 Claude 除了做到這個流程以外，還有哪些值得我們來講一講的地方呢？

Claude 不會每個問題都去搜尋網路，而是會先評估問題的性質，根據不同的問題類型有不同的策略

穩定知識（Stable Knowledge）👉 不需搜尋
- 基礎科學原理、歷史事件、數學概念等不會改變的知識
- 例如「光合作用的原理」、「二次大戰的起因」
- 策略：直接從訓練資料中回答，節省時間並確保準確性
時效性資訊（Time-sensitive Information）👉 立即搜尋
- 股價、天氣、最新新聞、近期事件等快速變化的資訊
- 例如「今天的美元匯率」、「本週的颱風動態」
- 策略：立即執行網路搜尋，確保提供最新資訊
複雜研究任務（Complex Research）👉 多次搜尋
- 需要比較多個來源或深入分析的綜合性問題
- 例如「分析各大雲端服務商的 AI 功能比較」
- 策略：執行多輪搜尋，從不同角度收集並整合資訊

Claude 有兩種主要的網路資訊擷取工具，會根據任務需求選擇使用：

web_search（網路搜尋）：像使用 Google 搜尋一樣，輸入關鍵字後獲得多個網頁的摘要。適合探索性查詢、需要比較多個資訊來源，或是不確定哪個網站有答案的情況。
web_fetch（網頁擷取）：直接讀取特定網址的完整內容，類似開啟網頁詳細閱讀。當你提供具體網址，或 Claude 在搜尋結果中發現重要文章需要深入了解時，就會使用這個工具。

這兩個工具經常協同運作：先用 web_search 找到相關資源，再用 web_fetch 深入閱讀最重要的幾篇。

畢竟網路上其實並不是所有的內容都可信，很多時候需要去旁判斷它的來源

而 Claude 在使用網路資源時有這樣一套處理原則：

資訊整合而非複製
- 不會直接複製貼上網路內容
- 理解、分析後用自己的方式重新表達 👉 確保不侵犯版權
- 引用原文時會限制在極短句子內，並明確標註來源
來源標註與可信度評估
- 回答中會標明資訊來源連結
- 優先採用官方網站、學術機構、知名媒體等可信來源
- 不同來源資訊衝突時 👉 明確指出差異供使用者判斷
結構化呈現資訊
- 將零散的網路資訊整理成有條理的回答
- 去除重複內容，保留關鍵資訊
- 以易讀格式呈現 👉 讓使用者快速掌握重點