Azure Machine Learning(我發現微軟的印度團隊會簡稱 AML,其他其他團隊更常用的是 Azure ML 這個詞)是 Microsoft Azure 提供的雲端機器學習平台,目的在幫助資料科學家和 AI 工程師實現機器學習專案的研發、部署及管理。AML 提供從資料處理、模型訓練、模型部署到持續監控與優化等全面的解決方案,並且支援 MLOps(Machine Learning Operations)。使用者可以在 AML 平台上進行資料的管理、模型的開發、部署和持續監控,無需操心基礎設施的管理,這讓 AI 專案的開發和部署更加高效。
AML 是一個雲端全託管的機器學習服務,開發者和資料科學家可以專注於模型開發,而無需擔心硬體設置和基礎設施管理。這尤其對於需要大規模運算資源的 AI 專案來說尤為重要,因為 AML 可以隨時彈性調整運算資源,比如選擇使用 GPU 訓練和部署模型。
在傳統的本地環境中,購買和維護高性能的 GPU 是一個挑戰,尤其在 GPU 需求增加的時代,成本高且不易獲取。AML 提供了隨用隨付的計算資源,你可以根據專案需求靈活啟用 GPU 或其他計算資源,並且只在需要訓練模型時付費。尤其是這波生式 AI 爆發,很多人都搶不到 GPU,這時候用 AML 的 GPU 就是一個不錯的選擇。
AML 預設配置好了一系列開發環境,這樣開發者不必再為配置 CUDA、Python 環境、Notebook、TensorFlow、PyTorch 等而煩惱。使用者只需點擊幾下即可啟用完整的機器學習開發環境,極大地減少了開發過程中的時間和精力。
在本地環境中,當多個團隊成員需要共享同一台 GPU 時,資源分配會變得複雜。AML 提供了靈活的計算資源管理功能,允許多位工程師或多個專案同時使用雲端資源,無需擔心資源衝突。
Azure Machine Learning 跟上了這波生成式 AI 大爆發,其轉型主要集中在以下幾個新功能:
大語言模型部署:AML 現在支持大語言模型的訓練和部署,使開發者可以輕鬆運行 Llama 或是 Hugging Face 等開源大語言模型。
Prompt Flow:這是一個新功能,用戶可以透過圖形化介面的方式,來建立和管理 prompt 的流程,讓模型的輸出更加符合特定的應用需求。
RAG(Retrieval-Augmented Generation):生成式 AI 的另一個重要技術,結合了資料檢索與生成技術,為開發者提供更加準確且語義豐富的答案。Azure Machine Learning 也可以讓你跑 RAG。
Python SDK V2:新版 SDK 提供更靈活的 API,幫助開發者輕鬆整合和擴展 AML 的功能。這個也是希望這次可以加上的內容
明天我們就來開始建立一個 Azure Machine Learning 的 Studio 吧!