iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

tokenizer相關文章

共有 5 則文章

0 人追蹤

追蹤

鐵人賽 AI & Data DAY 4

2023 AI大型語言模型之旅 - 從0開始學習建構AI專案系列第 4 篇

前面我們也有提到滿多次Tokens的概念，中文又叫分詞像是GPT模型會看到GPT-3.5 turbo 16K、gpt-4 32k這裡的16K就是支援的Token...

shrine90459 ‧ 2023-09-19

鐵人賽 Mobile Development DAY 15

Ionic結合ChatGPT - 30天打造AI英語口說導師APP 系列第 15 篇

昨天我們完成了和AI對話的功能。然而，由於GPT模型有Token數量的限制，我們無法將無窮無盡的歷史對話上下文訊息全部交給GPT模型處理。這時候，我們就需要借助...

momochenisme ‧ 2023-09-15

鐵人賽 AI & Data DAY 6

2023 AI大型語言模型之旅 - 從0開始學習建構AI專案系列第 6 篇

今天繼續完成我們的履歷生成器目前我們只有一個輸入跟輸出使用者輸入完他的訊息後會回傳履歷給我那我們想要再給他一些功能讓他寫更好的履歷給我們像是應徵的工作類型，...

shrine90459 ‧ 2023-09-21

鐵人賽自我挑戰組 DAY 11

30天從零開始學習NLP(自然語言處理) 系列第 11 篇

今天我們要針對昨天說到的三個部份的第一個部分 Tokenizer 來做說明 (會先講一半) 以上圖出自 Hugging Face 官方 Tokenizer 的主...

肉彈 ‧ 2023-09-26

鐵人賽自我挑戰組 DAY 12

30天從零開始學習NLP(自然語言處理) 系列第 12 篇

解碼接著前一天的部分繼續說，昨天的整個流程是把自然語言文本再轉到數字 ID，那當然我們也可以把數字 ID 轉回自然語言文本，這個動作稱為 Decoding。...

肉彈 ‧ 2023-09-27