技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
12
0
AI & Data
進入AI的世界
系列 第
12
篇
➤D-12 主要學習理論-4(監督式學習、非監督式學習、半監督式學習)
15th鐵人賽
epoch
團隊
臣無禮
2023-09-27 08:16:34
1565 瀏覽
分享至
監督式學習
監督式學習的基本概念與特色
監督式學習(Supervised Learning)指人類在輸入機器的訓練資料時,預先提供了資料判斷的標準答案,以及所謂的標註(Label),並在輸出答案時判斷是否有誤差,並回饋給機器,尤其加以調整修正的一種學習方法。
約以70%資料進行模型建立與訓練,10%~15%資料來先行驗證模型的準確度與可靠度,再利用剩下的15%~20%資料來進行模型預測。
監督式學習的主要任務
①分類(Classification)。
②迴歸(Regression)。
監督式學習的函數表示方法:f(x) = y。
監督式學習主要的演算法
監督式學習因各種不同的需求有各種不同的演算法,但目前則可分為非類神經網路的「傳統機器學習模型」(Traditional Machine Learning)與「神經網路深度學習法」的兩大陣營。
非監督式學習
非監督式學習的基本概念
人類在訓練機器時並不會提供任何的標準答案,讓機器在訓練資料中,自己做特徵的選擇與抽取,並建立模型來對資料進行判斷與分析。
非監督式學習的主要應用
①分群(Cluster Analysis):將一大群的樣本依據其在維度空間上的距離,或樣本間的「相似度」(Similarity)將相類似的樣本聚為一群,力求群內樣本間的距離最小,群與群之間的距離最大的方法。
②維度縮減(Dimensionality Reducing):將多個「原始變數」透過某種運算濃縮組合成少數幾個抽象層次更高、更具代表性與解釋能力的「組合變數」。
③關聯分析(Association Rule):由輸入資料的特徵值中尋找特徵值彼此之間相關性很高的項目。
非監督式學習優缺點
①非監督式學習(Unsupervised Learning)的主要優點:
成本低速度快:不用人工干涉與標註,機器自行能針對資料的特性進行分群,成本低速度快。
發現資料的本質特色:找到人類對於資料本質上自然存在的特性與類別無法瞭解的部分。
②非監督式學習的主要缺點:
不夠精確:在分群時不知道自己的結果正不正確,所以常出錯,精確度不高。
無法調整:沒有判別正確錯誤的回饋資訊,所以其無法自動調整參數來修正模式。
分群的結果與人類目的不同:沒有人類的監督,機器會自行選擇特徵值差異性最大的來做分群的依據,如此分析結果就會與人類的預期差異很大。
非監督式學習的特色
學習哲學:人類不指導、不糾正。
函數表示:只有x沒有y。
主要應用:集群、連結規則、縮減維度。
集群☞將資料按照類似性分群。
連結規則☞找出相關性高的變數群。
縮減維度☞組合更高層次的特徵值。
主要演算法:K-Means、集群分析(Cluster Analysis)、主成成分分析(PCA)等。
優點:不用人工介入、最省力、成本最低。
缺點:準確率不高、無法自動修正調整、分群結果無法控制。
試用階段:探索階段。
半監督式學習
先執行監督式學習再執行非監督式學習
以少量標記的資料來訓練模型,以模型來預測為標記資料的類別,再將新標註好的資料加入新的訓練資料中,如此不斷的增加有標記的資料,提高預測的準確度。
先執行非監督式學習,再執行監督式學習
為目前最普遍的方式,也稱預訓練模式(Pre-training Model)或稱為遷移式學習(Transfer Learning),機器先經過大量的非監督式學習,產生大致適合的參數以後再針對特定的領域進行監督式學習來微調原來的參數,使其達到訓練的準確度標準,最著名的就是語言模型(Language Model)。
參考資料
人工智慧-概念應用與管理 林東清著
留言
追蹤
檢舉
上一篇
➤D-11 主要學習理論-3(機器學習學派理論與架構)
下一篇
➤D-13 主要學習理論-5【完】(強化學習)
系列文
進入AI的世界
共
30
篇
目錄
RSS系列文
訂閱系列文
2
人訂閱
26
➤D-26 核心應用☞自然語言處理-2(主要架構)
27
➤D-27 核心應用☞自然語言處理-3(特徵抽取1)
28
➤D-28 核心應用☞自然語言處理-4(特徵抽取2)
29
➤D-29 核心應用☞自然語言處理-5(主要演算模式1)
30
➤D-30 核心應用☞自然語言處理-6【完】(主要演算模式2)
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22198
篇
完賽人數
602
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
熟識南投軟體工程師推薦
如何練國考資訊題?
求救,erp 無法使用,ping封包 100% 丟失
Active Directory 環境中時間無法同步問題
筆電無法使用usb開機重裝系統
fortigate 60E 配IP給無限AP問題
電腦版Outlook 封存郵件無法包含有作標幟的郵件
CCNA相關問題詢問
switch 指令的應用
電商在販售商品時,可以自行縮短保固期限嗎?
熱門回答
求救,erp 無法使用,ping封包 100% 丟失
Active Directory 環境中時間無法同步問題
fortigate 60E 配IP給無限AP問題
筆電無法使用usb開機重裝系統
電商在販售商品時,可以自行縮短保固期限嗎?
熱門文章
大總結 - Win11 是對企業和私人的大改版
每日一篇學習筆記 直到我做完專題 :( [Day1]
每日一篇學習筆記 直到我做完專題 :( [Day2]
[翻譯]使用AI工具寫程式碼時如何避免「AI幻覺」?
Python 字串string 方法,zfill() & f"{i:0xd}" &浮點數格式化
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}