【Day25】最終功能驗收 - 專案的壓力測試 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 25

0

生成式 AI

智慧旅遊顧問--結合 LLM 與 RAG 架構的台灣旅遊資訊助手系列第 25 篇

【Day25】最終功能驗收 - 專案的壓力測試

17th鐵人賽

2025-10-09 19:36:50

137 瀏覽

分享至

一、端到端 (End-to-End) 功能驗證

首先要確認部署環境下的所有功能都能正確運行。這包括：

RAG 驗證：輸入只存在於 taipei.csv 中的專業問題，確認模型能從 FAISS 知識庫中檢索並給出準確答案。
Function Calling 驗證：輸入複雜的請求，例如「我想知道台北 101 的天氣，以及怎麼從那裡去故宮」，確認 AI 能正確調用兩個不同的 API 函式並將結果合併。
錯誤處理驗證：故意輸入無效的城市名稱，確認系統能返回我們設定的友善錯誤訊息。

二、專注於效能與延遲

在雲端環境中，回應時間是使用者體驗的關鍵。我們必須專注於效能測試：

延遲檢查：測量模型從接收提問到最終回覆所需的時間。特別是涉及 Function Calling 或 RAG 檢索的查詢，因為它們需要多個步驟，延遲可能會增加。
優化目標：確保多數查詢的回應時間都能保持在幾秒內，尤其要監控 Streamlit 頁面的載入速度。

三、關鍵的安全性檢查

最後驗證專案的安全性配置是否正確：

確認存放在 secrets.toml 中的 API 金鑰，是否已透過 Cloud Run 的環境變數安全地注入到容器中，並且沒有以任何形式暴露在前端或程式碼的日誌中。

【Day24】部署實戰 (二) - 推送容器與正式上線

【Day26】程式碼精簡與整理

系列文

智慧旅遊顧問--結合 LLM 與 RAG 架構的台灣旅遊資訊助手共 30 篇

目錄

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19856 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙