iT邦幫忙

2025 iThome 鐵人賽

DAY 6
0

前言

我們今天用 sagemaker studio 去學習如何建立一個 ML 專案,
SageMaker Studio 是 AWS 提供的整合式機器學習開發環境,它將資料準備、模型訓練、部署等所有 ML 流程整合在一個平台上
所以對於像我這樣的初學者來說是相對比較好上手的

什麼是 SageMaker Studio

SageMaker Studio 是一個基於 JupyterLab 的網頁版 IDE,專為機器學習工作流程設計

  • 統一的開發環境:集成 Jupyter Notebook、終端機、檔案管理等功能
  • 內建的 ML 工具:資料探索、模型訓練、實驗追蹤等
  • 彈性的運算資源:可以動態調整 instance 規格
  • 協作功能:團隊成員可以共享 notebook 和實驗

功能與特色

  • 多種 Kernel 支援:Python、R、Scala 等
  • Git 整合:直接連接 GitHub、CodeCommit 等
  • 實驗管理:SageMaker Experiments 追蹤模型訓練
  • 模型註冊:SageMaker Model Registry 管理模型版本
  • 部署工具:一鍵部署到 endpoint

讓我們開始

一般來說我們到 aws console 輸入 sageMaker sutdio 然後點擊進入頁面就可以看到,長這樣

day6-1

然後通常對於 aws 服務來說,要開始專案,跟著橘色的按鈕走普遍來說沒有錯

點擊 『Create a sageMaker Domain』

day6-2

這時候會看到上圖的東西,

這時候如果你沒有設置 vpc 記得去左上角搜尋 vpc 創建一個 vpc 網路空間

有 vpc 後點選 setup 按鈕,就會幫你快速設定,會要等一段時間...

Application and IDEs > 隨後到 studio 的頁籤

點擊『Open studio』(如圖)

day6-3

如果看到這個頁面就算成功了

day6-4

我們點擊 JupyterLab 開始我的著專案

這時候熟悉 jupter notbook 基本上介面是差不多的

這時候我們開始嘗試第一個專案開始實驗

# 導入必要的套件
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import sagemaker
from sagemaker.sklearn.estimator import SKLearn
import boto3

# 設定 SageMaker session
sagemaker_session = sagemaker.Session()
role = sagemaker.get_execution_role()
bucket = sagemaker_session.default_bucket()

print(f"SageMaker role: {role}")
print(f"S3 bucket: {bucket}")

(補充)如何移除剛才創建的

很多人可能擔心使用 aws 會衍生出其他費用,有可能只是好奇 sagemaker 的創建和使用所以沒用到要刪除

刪除基本上要注意幾點

  1. sagemaker studio

記得把 running instance active 相關的給停掉,目前只開一個的話應該很好發現

  1. space management ,User profile 要刪除

這個在 Admin configurations (左邊的導覽列中) -> Domain ->
這時候會看到自己的 Domain 優先把 space management, user profile 的內容刪除

這時候就可以刪除 Domain 了

  1. 移除 project file
    基本上這個位置在 s3 所以要去 s3 看 sagemakder studio 產生出來的 bucket 這時候可以把該 bucket 刪除

  2. 刪除相關服務
    像是 vpc, EFS volumes 等等這些都去檢查一下要刪除


打完收工!


上一篇
SageMaker基礎:機器學習開發環境設定
系列文
從零開始的AWS AI之路:用Bedrock與SageMaker打造智慧應用的30天實戰6
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言