iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 26
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 26

[DAY 26] 章節3-6: 阿伯日後談-監督式、半監督式、非監督式學習

  • 分享至 

  • xImage
  •  

3-6 阿伯日後談

博覽會後,太陽漸漸下山了,看著人漸漸散,阿伯也準備收拾攤子回家了,遠處看見飛哥跟小博走來,小博手上拿著一份剛料理好的炒麵,遞給阿伯說:「辛苦啦!」。

飛哥找了個位子坐了下來,跟收拾得差不多的阿伯聊了起來,「之後有打算怎麼發展嗎?阿伯。」飛哥詢問道。

「且戰且走吧,況且,這個社會不太需要老人了,我回去工作豈不是多了搶年輕人工作的罪名。」阿伯看著遠方的斜陽說著。

看著旁邊津津有味吃著炒麵的小博,阿伯說道:「年輕人未來無限可能啊!阿伯再教你一點東西吧!下午跟你說的 k近鄰分類演算法 屬於 監督式學習(Supervised Learning) ,在這之外,還有 非監督式學習(Unsupervised Learning) 呢!」

「甚麼是監督式學習?要...督誰啊?額...我是說監督。」小博嚼著麵沒把話說清楚。

監督式學習你可以想像就是在既有資料已經含有被標記(label)的類別或組別,可以根據這個類別方便建造模型或建立準則 。像是我知道這群人誰有病誰沒病與他們的生活習慣、基因等等資料,誰有發病這點就是一個可被標記的類別。 缺點是有時候資料可能會被標記錯誤,而影響建模的穩定性 ,你想想看是不是新聞偶爾會出現沒並被說有病的狀況發生呢!常見的方法有k近鄰分類演算法、決策樹、一般回歸、羅吉式回歸、支持向量機器(SVM)。」阿伯細心地說著。

「好像是耶,那非監督式呢?」小博繼續問道。

「相反的, 非監督式學習就是資料沒有任何的標記 ,在沒有任何準則的情況下從零開始慢慢學習。這種學習方式會更傾向一種客觀直覺的判斷準則,在沒有一個判斷基準前提下嘗試去找出資料的相異性。 缺點是分析跑完後,結果一定有,你不一定解釋的出來為何機器學習要這樣子分類。 常見的方法有階層式集群分析(Hierarchical clustering)、k-平均分群法(k-means clustering)、自映射網路(Self-organizing map)」阿伯繼續說道。

小博想了下突然眼睛一亮說:「喔喔!所以半監督式學習就是把主觀跟客觀兩邊的資訊一起結合,既有標記過的資訊,也有資料原始樣貌呈現的訊息,這樣就不會對其中一邊的資訊過度相信了,對吧?」

阿伯開心的笑著:「呵呵,沒錯,你頭腦真的不錯,半監督式學習通常是把監督式與非監督式的資訊以一定比例加起來,我之前常看到的就是兩個矩陣(監督式一個、非監督式一個)以不同比例相加,通常分類效果都有一定的提升呢!不過可能還是有其他的結合方式,之後就交由你去研討囉!」

「原來是這樣,我還在想這兩者要怎麼結合呢!阿伯真厲害!」小博開心的把剩下的餐點一掃而空。

「是啊!真厲害呢。」阿伯心想,望著遠方的餘暉會心一笑。

這笑容,是飛哥心中見過最美,也是最祥和的笑容。


資料參考:
https://oosga.com/thinking/difference-between-supervised-learning-and-unsupervised-learning/
https://www.ecloudvalley.com/zh-hant/machine-learning/


上一篇
[DAY 25] 章節3-5: 綠豆阿伯的過去-KNN(K近鄰分類演算法) (2/2)
下一篇
[DAY 27] 章節3-7: 對立的雞群們- k-means(k平均分類演算法) (1/2)
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言