iT邦幫忙

2025 iThome 鐵人賽

DAY 3
1
生成式 AI

LangChain 愛 Azure AI系列 第 3

Day03-完整圖文建立Azure OpenAI

  • 分享至 

  • xImage
  •  

本日我們將建立一個 Azure OpenAI,以便後續將其與 LangChain 整合進行文本生成或 embedding 等操作。

OpenAI 家族的模型幾乎都可以在 Azure OpenAI 裡建立與部署(畢竟微軟是 OpenAI 的爸爸 )。但是很可惜的是,目前 GPT-5 是有條件開放的,我就算是微軟 AI MVP,也一直沒拿到取權限 🥲🥲。那麼接下來我們來一步步建立吧,記得要先有一個 Azure 帳號哦!

  1. 登入 Azure 入口網站,在上面的 search bar 輸入 OpenAI,點擊進去後就可以到 Azure OpenAI 的頁面了。

如下圖所示,可以看到左邊選單,微軟已經把 Azure OpenAI 放到 AI Foundry 類別了,但是還是可以在 AI Foundry 外面建立 Azure OpenAI 的。

我們點擊圖中的 Create,就可以開始建立了。

lanchain love azure ai 系列文

  1. 接著把訂用帳戶、資源群組等資訊填寫進去

輸入資源名稱,例如 ironman2025(名稱需全球唯一)。

選擇支援 Azure OpenAI 的地區,我推薦 East US 2 常常會優先上新模型。

而 Azure OpenAI 目前只有一種定價標準 (Standard S0) 可選,沒有免費。

如下圖所示,接著點下一步。

  1. 網路設定這裡有三種
    1. All networks:所有網路(包含公用網際網路)都可以存取這個資源,只要有 key。方便測試、開發或需要快速存取時使用。

    2. Selected networks:僅允許來自特定網路,常見於企業環境,用來限制存取來源,提升安全性。需要在 Azure Portal 中設定允許的 IP 位址範圍或 VNet 規則。

    3. Disabled (僅私有端點):不允許任何網路直接存取。若要存取,必須透過 Private Endpoint(專用私有端點)。要透過 Azure Private Link 建立資源與虛擬網路間的專用連線,最安全也最麻煩,還有錢的問題。

      這裡我們選 ALL 就好了,如下圖所示。

lanchain love azure ai 系列文

  1. 接著 Tag 可以依你的需求加上去,最後就可以建立了,建立過程可能需要幾分鐘。每個訂閱默認配額有限,確保地區選擇正確且配額足夠。

  2. 進到 Portal 裡。

建立完成後,我們可以進到 Azure OpenAI 的 Portal 裡,現在這個 Portal 其實是 AI Foundry 的 portal。如下圖所示。

lanchain love azure ai 系列文

  1. 進到 Portal 之後,我們可以看到畫面中就叫你 Create a deployment,就是要部署一個 AI model 起來,我們就點進去。如下圖所示。

lanchain love azure ai 系列文

  1. 在部署畫面中,我們可以選到 gpt-4.1,然後 confirm,如下圖所示。

lanchain love azure ai 系列文

  1. 在建立 gpt-4.1 模型時,會有要填寫如下圖的表單,說明如下。

Deployment name 是你要給這個部署的名字,例如這裡填的是 gpt-4.1,你也可以取名成 gpt-4.1-5566,這是可以任意取名的。這個名字會在寫程式時 API 呼叫中當作 deployment name 使用,而不是直接用 model name。

Deployment type 這裡選擇 Global Standard。Global Standard 的意思是使用全球共享推理容量,API 請求會由 Microsoft 的全域基礎設施處理。擁有最高速率限制,也就是說如果那一瞬間全球有大量請求的話,就會變慢。但是這個最便宜。

Deployment details 是可以展開的。Model version upgrade policy 是控制模型升級方式,這裡我們選 Upgrade once new default version becomes available,也就是當有新版本釋出時,系統會自動升級。

你也可以改成手動,避免升級造成 API 行為變化。

Model version 目前顯示的是 2025-04-14 (Default),代表現在的預設版本是 2025 年 4 月 14 日發佈的版本。

AI resource 這裡是你剛剛建立的 Azure OpenAI 資源名稱,這裡可看到我們剛剛建在 East US 2 的 Azure OpenAI 資源沒有 GPT-4.1,所以他幫我選了另一個有 GPT-4.1 的地方。

Tokens per Minute Rate Limit 是控制每分鐘可處理的 token 數上限,我們把他拉到最大為 5M (五百萬 tokens/min)。

如果超過這個限制,請求會被拒絕或限流。

Content filter 是內容過濾,預設為 DefaultV2,Azure 會提供一組安全過濾器,用來過濾有害或敏感的輸入/輸出。

lanchain love azure ai 系列文

填寫完後,我們按建立,就完成啦!!如下圖所示,我們可以在 Deployments 選單看到這個模型的資訊

lanchain love azure ai 系列文

明天我們就開始用 LangChain 來寫程式吧!


上一篇
Day02-Azure 現在 AI 相關服務的現況與 AI Foundry 介紹
系列文
LangChain 愛 Azure AI3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言