Day28 - Vertex AI 資源耗盡與模型重構心得 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 28

Cloud Native

《30 天 Cloud Native：AI 行程規劃後端開發》系列第 28 篇

Day28 - Vertex AI 資源耗盡與模型重構心得

17th鐵人賽

uncured7036

2025-09-11 20:03:31

88 瀏覽

分享至

因為一直在修改和測試功能，觸發 Vertex AI 資源耗盡：

google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'Resource exhausted. Please try again later. Please refer to https://cloud.google.com/vertex-ai/generative-ai/docs/error-code-429 for more details.', 'status': 'RESOURCE_EXHAUSTED'}}"

問了 Gemini 後發現可以到 Quotas & System Limits 查使用狀況，很精彩的 Vertex AI API 達到 71.67% ：

不過可能是東京的 Server 太多人用，不管怎麼調都還是顯示資源耗盡，後來直接換到新加坡的 Server 才解決。

🧱 模型結構重構：Literal → 型別別名

今天做了不少的程式碼調整，原本在 Activity 模型中，活動類型與交通方式是直接使用 Literal[...] 進行定義。這次更新將其抽象為可重用的型別別名：

ActivityType = Literal["sightseeing", "restaurant", "shopping", "accommodation", "freeTime", "transport", "other"]
TransportType = Literal["train", "highSpeedTrain", "flight", "bus", "taxi", "bike", "walk", "car", "boat", "motorcycle", "other"]

並搭配對應的 tuple 常數 ACTIVITY_TYPE 和 TRANSPORT_TYPE，方便後續在 JSON 轉換或驗證時使用索引存取。這樣的設計不僅提升了模型的可讀性，也讓型別在其他模型（如 QueryPayload）中得以重複使用，減少重複定義。