iT邦幫忙

2023 iThome 鐵人賽

DAY 26
0
自我挑戰組

AI對我們的影響系列 第 26

Day 26: Hugging Face介紹(二)

  • 分享至 

  • xImage
  •  

組成的元件

使用Hugging Face務必要了解最重要的三大元件, 基本上各種任務的模型(語音辨識、影像分類、NLP…), 都是離不開這三大元件的。

Transformers

顧名思義就是為了處理各種Transformer模型而開發的元件。

Tokenizers

我們都知道NLP的世界裡, 文字的最小的單位就是詞, 而要將文字化成詞的關鍵就是斷詞, Tokenizers就是扮演著這個角色, 提供了不同的策略也支援前處理、後處理。

Datasets

我們都知道AI訓練的重要養分來源就是資料集, 而Datasets元件就是扮演著如何將資料集管理好的角色, 並提供豐富的API(隨機分類、切割、整合pandas), 讓我們更容易的處理資料。

https://ithelp.ithome.com.tw/upload/images/20231006/20161923JInnMJvDdA.png


上一篇
Day 25:Hugging Face介紹
下一篇
Day 27: 用 transformers 快速打造文字生成器(一)
系列文
AI對我們的影響30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言