iT邦幫忙

2021 iThome 鐵人賽

DAY 13
0
AI & Data

一起學習 Azure Machine Learning 系列 第 13

[DAY13] 在 Azure Machine Learning 裡 Label data(中)

  • 分享至 

  • xImage
  •  

DAY13 在 Azure Machine Learning 裡 Label data(中)

昨天我們做好了寶可夢影像檔的 Datastore,今天我們就來建立 Label Data 的專案吧!

Label Data 專案設置

  1. 我們在左邊選單中點選 Data Labeling,然後點擊中間的 Create。
    Label Data in Azure Machine Learning

  2. 接著會跳出一個視窗,我們來開始一連串的建立流程吧!我們先看到中間的 Media Type 來做說明。Image 這個有四種不同的選項,分別說明如下:

  • Image Classification Multi-class:這個是一張影像一個答案的題目。例如說這個影像裡只有狗、或是只有貓,就用選擇這個。
  • Image Classification Multi-label:這個是一張影像裡會有多個答案的題目。例如說照片中會同時出現貓和狗,或是更多的要分類的類別在裡面。
  • Object Identification(Bounding Box):這個是物件偵測用的,會要拉一個 Bounding Box 把目標物件框起來,常見的算法如 YOLO 系列,就會使用這種做標記
  • Instance Segmentation(ploygon):這個是物件分割的題目時用的,會把欲辨識的目標切得更細,常見的算法如 Mask-RCNN 之類的。
    Label Data in Azure Machine Learning
  1. Text 這個有兩種不同的選項,就顧名思義就是一句話一個 Label,或是一句話多個 Label。
    Label Data in Azure Machine Learning

  2. 我們這次的題目是要分別出皮卡丘和謎擬Q,因此我們就選擇 Image Classification Multi-class 吧!把專案名稱取名為 Pokemon,按下 Next。
    Label Data in Azure Machine Learning

  3. 接著我們點左上角的 Create dataset,選 From datastore。
    Label Data in Azure Machine Learning

  4. 接著會跳出一個視窗,我們來建立一個 Dataset,填入名稱和描述後,按 Next。
    Label Data in Azure Machine Learning

  5. 接著選擇 Datastore,選到我們昨天建立好的 Datastore,在 Path 那裡輸入 * 號,代表裡面的照片我們都要。你也可以用過濾你要的檔案。
    Label Data in Azure Machine Learning

  6. 接著就點 Create。
    Label Data in Azure Machine Learning

  7. 再選起那個剛剛建立的 Dataset,按 Next。
    Label Data in Azure Machine Learning

  8. Incremental refresh 這裡可以勾起來,會幫我們檢查新 data。
    Label Data in Azure Machine Learning

  9. 接著輸入你要標記的答案,我們就輸入 Pikachu 和 Mimikyu,這裡建議再預留著一個 Other 類別,以避免資料集裡出現其他的東西。然後按 Next。
    Label Data in Azure Machine Learning

  10. 這個是標記的指導文件。我們之前說過,Azure Machine Learning 是一個適合多人協作的平台,這個頁面是讓你把標記的專案給其他團隊成員做時,能夠有個參考依據。這邊我們先隨便打一些東西。
    Label Data in Azure Machine Learning

  11. 這個頁面是 Azure 提供 AI 輔助標記,不過只對於一些常見的類別有用,對於寶可夢是沒有作用的,建議可以關起來。然後點 Create Project。
    Label Data in Azure Machine Learning

  12. 接著等待一下就會完成啦!
    Label Data in Azure Machine Learning

結果今天又破千字了,寫 Markdown 真的很會字數很多。

今天我們已經把資料標記的專案建立好了,明天我們就來學習怎麼做資料標記,以及如何把標記好的資料給匯出。


上一篇
[DAY12] 在 Azure Machine Learning 裡 Label data(上)
下一篇
[DAY14] 在 Azure Machine Learning 裡 Label data(下)
系列文
一起學習 Azure Machine Learning 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言