最近在處理影像標籤的問題,我有很多個樣本,而且需要不斷增加,每個樣本都會經由一個AI 分析後,回傳最有可能有關於這張圖片的十個標籤例如['apple','car',tree'....],我會把他轉成對應類別index 例如[ 2533,23,53,13...],我嘗試把這些標籤拿去進行Fuzzy C-Means,但發現效果很差,很有可能是是index差異太大導致的, 想請問各位有沒有其他方式可以把這十個標籤自己區分好幾個類別,由於標籤數很多,我想使用非監督的方式來幫我輸出幾個類別, 我目的是想找出a圖其他相關的圖片,請問有什麼方式可以實現嗎?
非監督式學習,尤其是使用切割方式的話,使用的數據必須有連續性才有其效果。
如果使用label的index,而其未經過任何合理、有意義的排序的話,那麼便無法切割出有意義的結果。
以下給出幾個方向:
希望有幫助到您=^w^=