iT邦幫忙

2024 iThome 鐵人賽

DAY 4
0

我們昨天建立好了 Azure Machine Learning 的 workspace ,今天來看 Studio 的部份。在 Azure Machine Learning 裡,其實我們大部份的工作,都會在 Studio 做操作。

回到昨天建立好的畫面,如下圖,我們點擊畫面右下角的 Launch Studio。

生成式 AI 時代下的 Azure Machine Learning 教學圖文

接著,我們就會進到 Azure Machine Learning Studio 的畫面了。如下圖所示,我們來分析和說明下圖。我們可以看到多個不同的功能區域和工具,包括生成式 AI、訓練模型的範例 Notebook、資源管理等,接下來我們就來一個一個說明。

生成式 AI 時代下的 Azure Machine Learning 教學圖文

1. 左側選單功能主要功能介紹

左側選單列出了 Azure Machine Learning Studio 的主要功能,這些功能涵蓋了機器學習開發的各個階段,包括資料管理、模型開發、計算資源分配等。

1.1 Home

Home 是工作區的主頁,在這裡你可以快速瀏覽當前項目的概況和可用的工具。畫面上有一些推薦的功能區塊,比如 Generative AI with Prompt flow,提供了生成式 AI 的多種應用模板,如「Multi-Round Q&A on Your Data」和「Chat with Wikipedia」,這些可以幫助用戶快速上手特定的 AI 任務。這是我們接下來會主力教學的功能。

1.2 Model catalog

Model catalog 提供了許多的 AI 模型列表,有從 HuggingFace 來的,也有從 Meta 來的。你可以在這裡找到預訓練好的模型,大部份都是開源的模型。然後快速部署起來成 endpoint 來使用。

1.3 Notebooks

Notebooks 是進行 ML 開發的核心工具之一,簡單來說就是 Azure Machine Learning Studio 裡的 Jupyter Notebooks。你可以在這裡編寫和執行機器學習的程式碼,並且能夠連接 Azure 的計算資源來加速訓練。

1.4 Automated ML

Automated ML 讓用戶能夠自動化機器學習流程。你只需上傳資料並定義任務目標(如分類、迴歸、電腦視覺等),Azure 會自動測試多種模型和參數,為你選擇最佳的方案。這對於不熟悉機器學習的用戶來說是一個非常有用的工具,能夠大幅縮短開發時間。現代來說,我們常常會專案一開始就先用 Automated ML 來試跑個結果,再來做進一步的調整和優化。

1.5 Designer

Designer 是一個 no code/low code 的機器學習設計工具,使用拖放式介面來構建機器學習流程。你可以將不同的模組(如資料輸入、轉換、模型訓練等)連接在一起,以建立 ML 的 pipeline。

1.6 Prompt flow

Prompt flow 是針對生成式 AI 的工作流設計工具,也是 Azure ML 華麗轉身最重要的工具。該功能幫助用戶創建多輪對話和特定任務的生成式 AI 應用。在主頁中,你可以看到「Multi-Round Q&A on Your Data」和「Chat with Wikipedia」等多個生成式 AI 應用模板。這些應用可以幫助用戶快速開發和測試基於生成式 AI 的解決方案。


2. Asset 管理功能介紹

接下來的幾個模組集中於機器學習開發中的 asset 管理,包括資料集、訓練作業、模型組件等。

2.1 Data

Data 模組是用來管理你的資料集。在這裡,你可以上傳、儲存和處理訓練資料。Azure 支持多種數據來源,包括本地文件、Azure Blob Storage 或其他雲端數據存儲服務。你可以在這裡將資料集版本化,以便追蹤數據的歷史版本,這個功能在我們以前都還要找開源工具來自建,現在 Azure ML 都幫你做好了。

2.2 Jobs

Jobs 是用來管理機器學習訓練和推理作業的地方。每當你提交一個訓練任務,它就會在這裡顯示,你可以查看作業的狀態、性能指標和日誌,並進行調整。

2.3 Components

Components 是機器學習管道中的可重用組件。它們可以是資料處理步驟、模型訓練步驟等,這些組件可以被多次使用,幫助你在不同的管道中節省開發時間。

2.4 Pipelines

Pipelines 是機器學習的完整工作流,將資料準備、模型訓練、評估和部署等步驟連接起來。在這裡,你可以設計、運行和管理多步驟的機器學習流程,並通過調度來自動化工作流的執行。基本上就是你在 Designer 裡建立的 pipeline。

2.5 Environments

Environments 是用來定義機器學習訓練和推理作業的執行環境。你可以在這裡配置所需的套件和環境變數,而且還有預先幫你建好的多種環境可以使用。

2.6 Models

Models 是用來管理和註冊你訓練完成的機器學習模型。你可以在這裡上傳、版本化並跟踪模型,並且將它們部署到不同的環境中進行推理。要注意這裡和上面提的 Model catalog 不一樣哦,這裡的 model 是你自己訓練出來的 model。

2.7 Endpoints

Endpoints 是用來管理和部署機器學習模型的 API 端點。你可以將模型部署為real-time 的 REST API,並在這裡進行監控和管理,確保模型在生產環境中的穩定運行。


3. 管理功能模組

3.1 Compute

Compute 是管理計算資源的地方。你可以在這裡創建和管理計算實例(供單人使用的虛擬機)、計算群集(適合大規模訓練的分佈式資源),以及附加資源如 Azure Kubernetes Service (AKS) 用來進行大規模的推理服務。

3.2 Monitoring

Monitoring 是用來監控所有資源和作業的模組。在這裡,你可以查看計算資源的使用情況、訓練作業的狀態、API 端點的性能等,幫助你優化資源利用並確保系統的穩定性。

3.3 Data Labeling

Data Labeling 是為需要標記資料的機器學習任務提供的工具。你可以通過該模組進行數據的手動或自動標記,幫助你準備更精確的訓練資料。


上面的功能,大部份都有在我 2021 年寫的系列文裡做介紹了。我們這次的系列主題,會更關注在生成式 AI 相關的新功能。有興趣學習上面這些已有的舊功能的朋友,可以到參考這個連結: https://ithelp.ithome.com.tw/users/20120030/ironman/4905


上一篇
Day03-建立 Azure Machine Learning
下一篇
Day05-Azure Machine Learning 的 Model Catalog 介紹
系列文
生成式 AI 時代下的 Azure Machine Learning30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言