昨天我們做好了寶可夢影像檔的 Datastore,今天我們就來建立 Label Data 的專案吧!
我們在左邊選單中點選 Data Labeling,然後點擊中間的 Create。
接著會跳出一個視窗,我們來開始一連串的建立流程吧!我們先看到中間的 Media Type 來做說明。Image 這個有四種不同的選項,分別說明如下:
Text 這個有兩種不同的選項,就顧名思義就是一句話一個 Label,或是一句話多個 Label。
我們這次的題目是要分別出皮卡丘和謎擬Q,因此我們就選擇 Image Classification Multi-class 吧!把專案名稱取名為 Pokemon,按下 Next。
接著我們點左上角的 Create dataset,選 From datastore。
接著會跳出一個視窗,我們來建立一個 Dataset,填入名稱和描述後,按 Next。
接著選擇 Datastore,選到我們昨天建立好的 Datastore,在 Path 那裡輸入 * 號,代表裡面的照片我們都要。你也可以用過濾你要的檔案。
接著就點 Create。
再選起那個剛剛建立的 Dataset,按 Next。
Incremental refresh 這裡可以勾起來,會幫我們檢查新 data。
接著輸入你要標記的答案,我們就輸入 Pikachu 和 Mimikyu,這裡建議再預留著一個 Other 類別,以避免資料集裡出現其他的東西。然後按 Next。
這個是標記的指導文件。我們之前說過,Azure Machine Learning 是一個適合多人協作的平台,這個頁面是讓你把標記的專案給其他團隊成員做時,能夠有個參考依據。這邊我們先隨便打一些東西。
這個頁面是 Azure 提供 AI 輔助標記,不過只對於一些常見的類別有用,對於寶可夢是沒有作用的,建議可以關起來。然後點 Create Project。
接著等待一下就會完成啦!
結果今天又破千字了,寫 Markdown 真的很會字數很多。
今天我們已經把資料標記的專案建立好了,明天我們就來學習怎麼做資料標記,以及如何把標記好的資料給匯出。