# Day16- Fine-tune Transformer --- 訓練模型篇

2022 iThome 鐵人賽

DAY 16

AI & Data

變形金剛與抱臉怪---NLP 應用開發之實戰系列第 16 篇

14th鐵人賽 huggingface azure machine learning transformer

大魔術熊貓工程師

2022-10-01 02:35:15

8022 瀏覽

分享至

我們把昨天的 dataset 做好分詞之後，就可以來訓練自己的模型啦！

載入 PyTorch 和使用 CUDA，然後再用 AutoModelForSequenceClassification 來載入 pre-trained model。需要特別注意的是，這裡我們要設定 label 的數量，要符合 dataset 裡的 label 數量。也建議指定好 id2label 和 label2id，之後在做 inference 時結果才會比較易讀。最後要記得加上 .to(device)。

from transformers import AutoModelForSequenceClassification
import torch

num_labels = 4
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

model = (AutoModelForSequenceClassification
        .from_pretrained(model_name, num_labels=num_labels
        ,id2label={"0": "negative",
                    "1": "positive",
                    "2": "no_impact",
                    "3": "mixed"}
        ,label2id={"negative": "0",
                    "positive": "1",
                    "no_impact": "2",
                    "mixed": "3"})
         .to(device))

接著我們用 TrainingArguments 來設定參數。output_dir 建議要設定，會幫你建議一個資料夾然後把 checkpoint 和最後跑完的模型存在裡面。
TrainingArguments 有九十幾個參數可以設定，極其複雜，但也很方便，很多功能你想有沒有會有，去讀 source code 和[文件]
(https://huggingface.co/docs/transformers/main_classes/trainer)，就發現 Hugging Face 已經幫你做好了，只要設定一下就可以了。
report_to 這個欄位要特別注意，如果你是用 MLFlow 之類的工具，可以設定為 mlflow，這邊我們用 Azure Machine Learning ，所以設定為 azure_ml，建議要設定，否則預設值是 all，可能會出現參數過多的 bug。

from transformers import Trainer, TrainingArguments

batch_size = 64
logging_steps = len(sentiment_encoded["train"]) // batch_size
model_name = "poem_model"
training_args = TrainingArguments(output_dir=model_name,
                                  num_train_epochs=40,
                                  learning_rate=2e-5,
                                  per_device_train_batch_size=batch_size,
                                  per_device_eval_batch_size=batch_size,
                                  weight_decay=0.01,
                                  evaluation_strategy="epoch",
                                  disable_tqdm=False,
                                  label_names= labels,
                                  report_to = "azure_ml",
                                  logging_steps=logging_steps)

接著我們用 sklearn 來設定一個 function，用在訓練模型的期間可以監控 accuracy_score 和 f1_score。

from sklearn.metrics import accuracy_score, f1_score

def compute_metrics(pred):
    labels = pred.label_ids
    preds = pred.predictions.argmax(-1)
    f1 = f1_score(labels, preds, average="weighted")
    acc = accuracy_score(labels, preds)
    return {"accuracy": acc, "f1": f1}

接著就開始訓練我們的模型啦！下面程式碼跑下去之後，就先去泡杯咖啡，耐心等待一下吧！

from transformers import Trainer

trainer = Trainer(model=model, args=training_args,
                  compute_metrics=compute_metrics,
                  train_dataset=sentiment_encoded["train"],
                  eval_dataset=sentiment_encoded["validation"],
                  tokenizer=tokenizer)
trainer.train()

跑完之後，我們會注意到左邊多了一個資料夾，這就是我們模型存放的地方了，如下圖。

koko hugging face azure machine learning

接著我們用前幾天教的 pipeline 的方式，來載入模型吧！程式碼如下。

from transformers import pipeline

classifier = pipeline(task= 'sentiment-analysis', 
                      model= "poem_model")

然後再把前幾天在玩的句子，再放進來。

classifier(
    [
        "Only those who will risk going too far can possibly find out how far one can go.",
        "Baby shark, doo doo doo doo doo doo, Baby shark!"
    ]
)

會得到類似於下面的結果：

[{'label': 'no_impact', 'score': 0.7432655692100525},
 {'label': 'no_impact', 'score': 0.9643214344978333}]

好的，顯然這兩句話，在經過這個資料集訓練後，就變得不太重要了。不過也可能是這個資料夾嚴重的資料偏差所導致的哦！

以上就是 Transformer 拿自己的資料來做 fine-tune 的方法了，明天我們來講 Transformer 的幾種型態吧！

# Day15- Fine-tune Transformer --- 資料處理篇

# Day17-Transformer 的種類

系列文

變形金剛與抱臉怪---NLP 應用開發之實戰共 30 篇

RSS系列文訂閱系列文

42 人訂閱

完整目錄

直播研討會

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22199 篇

完賽人數

600 人

一秒鐘破解一個密碼？網站如何應對多變的撞庫攻擊？

臺灣資安大會 |

32 分

企業資安治理新思維

臺灣資安大會 |

33 分

利用 Ruckus IoT 技術，輕鬆數位轉型邁向智慧企業

IT EXPLAINED |

41 分

運用資料和分析領導團隊度過疫情

IT EXPLAINED |

41 分

揭開 API 安全核心：全球趨勢與策略因應方法

IT EXPLAINED |

43 分

全民必懂的AI通識課

iThome鐵人賽 |

35 分

強化零信任安全，運用 CloudKnox 管理您的多雲基礎架構

CYBERSEC NOW |

25 分

如何將數據搬上 Elastic 雲端託管服務

IT EXPLAINED |

33 分

Cloudflare：DDoS Protection 與 API Shield 助力企業全方位應對安全威脅

Cloud Summit 臺灣雲端大會 |

25 分

IT現代化打造企業數位體質

IT EXPLAINED |

50 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

變形金剛與抱臉怪---NLP 應用開發之實戰系列 第 16 篇