iT邦幫忙

2023 iThome 鐵人賽

DAY 6
0
AI & Data

機器學習新手行,相信你也行!系列 第 6

踏上旅途~監督式學習 —— 簡單介紹二元分類和多元分類

  • 分享至 

  • xImage
  •  

熬夜沒睡飽好像成為每天必抱怨的事項了,今天畢竟踏上旅途,我們話少一些,直接開始吧!


我們在一開始有簡單說明機器學習的類型
今天的內容就是要來仔細說一下關於這些類型
讓我們從監督式學習開始吧!

監督式學習(Supervised Learning)

監督式學習是電腦知道每一個問題的答案,當已知答案的問題越做越多,對這類的問題理解也越來越深,正確率也越來越高,到最後可以自己預測或分類問題答案。

  • 標籤化資料:演算法的訓練資料集會有輸入的特徵和相對的輸出標籤,標籤就是想要模型學習的預測
  • 函數和模型訓練:使用函數來讓電腦能夠預測答案,在訓練過程中使用函數來最小化模型預測與實際標籤之間的差距
  • 泛化:能夠對新的、沒見過的資料準確的預測,而不只是在訓練資料上表現很好

常見的監督式學習演算法

  • 線性迴歸( Linear Regression ):用於預測連續數值,通過一條線來模擬資料之間的線性關係
  • 決策樹( Decision Trees ):基於資料特徵的二元分類樹,用於分類和迴歸問題
  • 隨機森林( Random Forest ):一種結合多個決策樹以提高預測準確性,用於分類和回歸問題
  • 神經網路( Neural Networks ):受生物的神經細胞所啟發的機器學習模型,用於處理複雜的模式識別和預測任務
  • 梯度提升樹( Gradient Boosting Trees ):一種通過多個弱學習器(通常是淺的決策樹)的組合,以改善預測能力
  • 貝氏分類器( Naive Bayes Classifier ):基於貝氏定理的統計分類方法,用於文本分類和垃圾郵件檢測
  • 邏輯迴歸( Logistic Regression ):用於分類問題的線性模型,用於預測二元結果
  • 支援向量機(Support Vector Machine):通過在特徵空間中找到最佳分離超平面,用於分類和迴歸的機器學習模型
  • K-近鄰演算法( K-Nearest Neighbors,K-NN ):根據最接近的鄰居來預測資料點的類別或值,用於分類和迴歸方法

監督型學習兩種主要類型

分類( Classification )

將輸入資料分為不同的類別或標籤,模型會用演算法學習如何將離散變數分類,通常用於區分不同的物體、事件或情境

迴歸( Regression )

模型學習如何預測一個或多個連續數值輸出,訓練演算法利用一個連續範圍內的可能值,需要識別輸入參數和輸出值之間的函數關係來預測輸出結果,通常用於估計數值

二元分類( binary classification )

二元分類目的是將資料分為兩個可能的類別或類別標籤之一,二元分類通常用於解決是否、正負、合格或不合格等只有二元決策的問題
二元分類是最基本和常見的分類問題,很多演算法都可以解決這些問題

多元分類 ( Multi-class Classification )

多元分類目的是將資料分為多個可能的類別或類別標籤之一。多元分類通常用於區分多個不同的對象、情境或事件
常見的實例有手寫數字識別(區分 0 到 9 )、圖像分類、自然語言處理中的文本分類等

優缺比較

二元分類的優點

  • 簡單高效
  • 多應用場景

二元分類的缺點

  • 信息有限

多元分類的優點

  • 應對多類別
  • 豐富資訊
  • 廣泛應用

多元分類的缺點

  • 複雜多樣
  • 不平衡分佈

今天好像給不了更多有用的資訊了
明天也是滿堂
明晚也有專題的事要處理
可能六日會比較有空
那時再把數學的東西
還有實作的部分仔細說說
應該喇


參考資料

https://medium.com/marketingdatascience/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E6%BC%94%E7%AE%97%E6%B3%95-%E7%9B%A3%E7%9D%A3%E8%88%87%E9%9D%9E%E7%9B%A3%E7%9D%A3%E5%BC%8F%E5%AD%B8%E7%BF%92-e9dbeee94a30
https://www.tibco.com/zh-hant/reference-center/what-is-supervised-learning
https://claire-chang.com/2023/01/11/%E4%BA%8C%E5%85%83%E5%88%86%E9%A1%9E-binary-classification-%E4%BB%8B%E7%B4%B9/


上一篇
冒險前準備~Python中的資料處理工具 —— Matplotlib
下一篇
中途休息站 —— 一些機器學習模型評估指標
系列文
機器學習新手行,相信你也行!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言