iT邦幫忙

2023 iThome 鐵人賽

DAY 4
0
AI & Data

擁抱AI - 瞭解AI的各項技術範疇及應用領域系列 第 5

[Day 5] 非監督式學習(Unupervised Learning) - 演算法篇

  • 分享至 

  • xImage
  •  

前面介紹過非監督式學習的特點了分別是服用事前標註資料,他就會從多筆資料中篩選出資料的特徵,並進行分類。今天我們要聊的是非監督式學習的演算法

非監督式學習相關演算法

K-Means:

K-Means主要用於數據分群與資料分類。該演算法將資料集的數據點分為K個不同的群集,其中K是預先指定的數量。它的工作方式如下:

例如當你今天要分析男女性別購買咖啡的比重時:

(1)初始化: 隨機選擇K個初始中心點,通常是從資料集中選取的數據點。
e.g., 我們一開始可以將k設為2,來代表男性和女性。

(2)分配: 將每個數據點分配到最接近的中心點所代表的群集。
e.g., 將男性和女性分為兩個不同的群集。

(3)更新: 計算每個群集的新中心點,通過取該群集內所有數據點的平均值。
e.g., 我們可以根據第(2)步計算每個性別(男性和女性)的平均購買咖啡比重,並將其作為新的中心點。

(4)重複: 重複步驟2和步驟3,直到中心點不再改變或達到預定的停止條件。

Clustering

屬於k-means的子集合,一樣主要用於分類。且步驟類似於K-Means,就不再贅述了。

PCA

PCA是一種數據降維技術,主要用於**降低多維數據的複雜性。**它通過找到數據中的主要變化方向,將原始特徵轉換成新的、線性無關的特徵,這些新特徵稱為主成分。這使得數據可以在更低維度下表示,同時保留了大部分重要信息,減少了計算和儲存的成本。

GAN

GAN主要用來生成逼真的假圖片。他有兩個主要部分,分別為生成網路及判別網路。生成網路的工作為努力創造樣本提供的真實圖片,而判別網路則試著分辨圖片真假。他的目標是要讓判別網路無法判斷照片的真假,當判別網路判斷不出來時,則GAN就達成目標了。之前很火紅的案子-YTR小玉換臉,就是利用此技術達成的。


上一篇
[Day 4] 非監督式學習(Unupervised Learning) - 特色及應用篇
下一篇
[Day 6] 生成式人工智慧(Generative AI)
系列文
擁抱AI - 瞭解AI的各項技術範疇及應用領域14
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言