Day 14 - 使用 Transformers (5) - PostProcessing - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2023 iThome 鐵人賽

DAY 14

自我挑戰組

30天從零開始學習NLP(自然語言處理) 系列第 14 篇

Day 14 - 使用 Transformers (5) - PostProcessing

15th鐵人賽 postprocessing transformers

肉彈

2023-09-29 23:19:54

558 瀏覽

分享至

今天我們要針對三個部份的最後一個部分 PostProcessing 來做說明

以上圖出自 Hugging Face 官方

PostProcessing這個動作事是用於對模型輸出進行一系列轉換和處理操作的入口，目的是使模型的輸出更加有用、易於理解並適合後續任務。

要補充一下，在昨天說到的 Model 的完整範例中，沒有說得很完整，因為使用 BertModel 或是 AutoModel，無法轉換為上圖中的 logits，所以來仔細說明一下。

我們使用另一個類 AutoModelForSequenceClassification 這個是一個通用文字分類模型，它能夠適用於多種文字分類任務，又或是我們如果要使用 BERT 相關的預訓練模型我們也可以直接使用 BertForSequenceClassification。

那我們就使用 BertForSequenceClassification 來當範例，一樣使用 day12那天得出的最後張量

{
    'input_ids': tensor([
        [101, 2769, 1962, 2682, 6206, 1139, 1343, 4381, 102, 0, 0, 0, 0, 0],
        [101, 791, 1921, 1921, 3706, 1962, 4229, 8024, 679, 6900, 1394, 1139, 7271, 102]]), 
    'token_type_ids': tensor([
        [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
        [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]),
    'attention_mask': tensor([
        [1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0],
        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]])
}

from transformers import BertForSequenceClassification

final_input = (上方的張量)
model = BertForSequenceClassification.from_pretrained("bert-base-chinese")

outputs = model(**final_input)
print(outputs.logits)

方法和昨天一樣，只是我們將 BertModel 換成 BertForSequenceClassification

輸出的結果

tensor([[-0.5755,  0.4357],
        [-0.9901,  0.1685]], grad_fn=<AddmmBackward0>)

這些 logits 是模型對每個範例的分類預測得分，分別表示兩個類別

PostProcessing

最後就是要將這個輸出結果轉換成機率。

import torch
import torch.nn.functional as F

# 將上面的output.logits存在final_logits
final_logits = outputs.logits

# 使用 softmax 函数将 logits 转换为概率分布
probabilities = F.softmax(final_logits, dim=-1)

print(probabilities)

torch.nn.functional.softmax是 PyTorch 中的函數，用於執行 softmax 操作
- softmax 操作的作用是將每個類別的得分轉換為相應類別的機率，使得這些機率總和等於 1。這對於多分類任務非常有用，因為將模型的轉換輸出為可解釋的機率分佈，使您能夠確定模型每個類別的置信度。
dim=-1表示在張量的最後一個維度上執行softmax操作，以獲得機率分布。在logits張量中，最後一個維度通常對應於類別

輸出的結果

tensor([[0.2667, 0.7333],
        [0.2389, 0.7611]], grad_fn=<SoftmaxBackward0>)

這是最後的機率分布張量，可以看到他前後的分數加起來總合為 1。

我們也可以讓他產生對應的標籤映射

label_map = model.config.id2label
print(label_map)

-> {0: 'LABEL_0', 1: 'LABEL_1'}

這是模型本身的對應標籤

import torch
predicted_indices = torch.argmax(predicted_labels, dim=1)
print(predicted_indices)

-> tensor([0, 0])

我們使用 argmax 這個方法找到機率最高類別的索引

predicted_labels = [label_map[label.item()] for label in predicted_indices]
print(predicted_labels)

-> ['LABEL_0', 'LABEL_0']

最後在套入進去 label_map 就可以得出對應標籤
兩個例子都是 'LABEL_0'

參考資料

Day 13 - 使用 Transformers (4) - Model

Day 15 - 使用 Transformers (6) - 單一序列和模型批次不匹配(補充)

系列文

30天從零開始學習NLP(自然語言處理) 共 30 篇

RSS系列文訂閱系列文

5 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22205 篇

完賽人數

600 人

你跟上 Platform Engineering 了嗎？超大型組織下一步

DevOpsDays |

38 分

Citrix 多工虛擬化解決方案協助企業增進生產力

Cloud Summit 臺灣雲端大會 |

24 分

2021 Q4 - Progress MFT 安全檔案傳輸管理軟體 - MOVEit Automation 培訓課程 (2)

EC NETWORKER |

113 分

找出看不見的敵人！別讓內網攻陷，成為待宰羔羊

臺灣資安大會 |

31 分

網路服務就是一連串搜尋的集合體

MWC |

38 分

幫服務建立觀測性，利用 ITSM 與自動化完成數位企業最後一哩路

Kubernetes Summit |

32 分

資料匿名化，安心用資料

臺灣資安大會 |

30 分

從公開發行公司股東會年報分析公發公司資安揭露情形

臺灣資安大會 |

27 分

【Esther Derby】Leaders at All Levels（Agile summit '23）｜TITANSOFT 鈦坦科技

鈦坦人開講 |

46 分

智慧製造的資安堡壘：零信任架構下的 OT 安全策略

IT EXPLAINED |

35 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

30天從零開始學習NLP(自然語言處理) 系列 第 14 篇

Day 14 - 使用 Transformers (5) - PostProcessing

PostProcessing

參考資料

尚未有邦友留言

標記使用者

30天從零開始學習NLP(自然語言處理) 系列第 14 篇