iT邦幫忙

2022 iThome 鐵人賽

DAY 19
0
AI & Data

【30天之新手學習筆記】PyTorch系列 第 19

Day 19 - 分類(Classification)介紹與實作

  • 分享至 

  • xImage
  •  

昨天的文章中主要提到了回歸的部分,它是屬於監督式學習中的一個類型,而今天的文章中我主要想提一下監督式學習中的另一個部分,那就是分類的部分.在分類的問題中,我們期望可以找到一個符合資料分佈的函數,如果能順利找到一個能將不同種類的資料分得很好,那麼往後要是有一筆新的資料進入,就能利用函數判斷它所座落的區域,並成功判別新資料的種類.

分類模型

  1. 二元分類(binary)

  2. 多分類(Multi-Class)

https://ithelp.ithome.com.tw/upload/images/20220929/20152671oYIBfF1vXY.png

分類問題是屬於監督式學習的範疇,在資料有被標籤(labeled)的情況下,透過分類模型可以找出明確的劃分線,將不同標籤類別區分出來.

以PyTorch實作分類模型(以不同顏色的點來呈現並計算準確度)

  1. 建立資料集
import torch
import matplotlib.pyplot as plt

n_data = torch.ones(100, 2)
x0 = torch.normal(2*n_data, 1)
y0 = torch.zeros(100)
x1 = torch.normal(-2*n_data, 1)
y1 = torch.ones(100)

x = torch.cat((x0, x1), 0).type(torch.FloatTensor)
y = torch.cat((y0, y1), ).type(torch.LongTensor)

plt.scatter(x.data.numpy(), y.data.numpy())
plt.show()
  1. 建立神經網路
import torch
import torch.nn.functional as F

class Net(torch.nn.Module):
    def __init__(self, n_feature, n_hidden, n_output):
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_feature, n_hidden)
        self.out = torch.nn.Linear(n_hidden, n_output)

    def forward(self, x):
        x = F.relu(self.hidden(x))
        x = self.out(x)
        return x

net = Net(n_feature=2, n_hidden=10, n_output=2) 

print(net)
  1. 訓練網路
optimizer = torch.optim.SGD(net.parameters(), lr=0.02)

loss_func = torch.nn.CrossEntropyLoss()

for t in range(100):
    out = net(x)

    loss = loss_func(out, y)

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
  1. 可視化訓練過程
import matplotlib.pyplot as plt

plt.ion()
plt.show()

for t in range(100):

    ...
    loss.backward()
    optimizer.step()

    if t % 2 == 0:
        plt.cla()
        prediction = torch.max(F.softmax(out), 1)[1]
        pred_y = prediction.data.numpy().squeeze()
        target_y = y.data.numpy()
        plt.scatter(x.data.numpy()[:, 0], x.data.numpy()[:, 1], c=pred_y, s=100, lw=0, cmap='RdYlGn')
        accuracy = sum(pred_y == target_y)/200.
        plt.text(1.5, -4, 'Accuracy=%.2f' % accuracy, fontdict={'size': 20, 'color':  'red'})
        plt.pause(0.1)

plt.ioff()
plt.show()

https://ithelp.ithome.com.tw/upload/images/20220930/2015267121Ci6JRQt6.png
這個分類模型總共生成了50張圖片,我們可以看到圖片裡明確的將所有的點都已紅色和綠色兩種進行分類,而準確率的部分由於樣本是自動生成的緣故,有些點過於接近而不好判斷,因此準確率並非完美的1.00.

參考資料:


上一篇
Day 18 - 迴歸(Regression)介紹與實作
下一篇
Day 20 - 卷積神經網路(CNN)的介紹
系列文
【30天之新手學習筆記】PyTorch30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言