技術問答
技術文章
iT 徵才
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
29
0
自我挑戰組
30天從零開始學習NLP(自然語言處理)
系列 第
29
篇
Day 29 - NER 模型檔案內容
15th鐵人賽
ner模型
模型檔案
huggingface
肉彈
2023-10-14 16:30:51
680 瀏覽
分享至
這篇我使用我之前上傳到 Hugging Face 的模型檔案來解說,那因為在模型訓練那部份我沒講到要如何上傳模型,因此等鐵人賽結束後我會再補充回去。
介紹兩個重要的部分 (先來說最重要的)
files : 模型的檔案
README.md:README 文件包含了模型的基本資訊,有關模型的描述性文件。
config.json:包含了有關模型配置的 JSON 檔案。它描述了模型的架構、超參數和其他配置資訊。
pytorch_model.bin:這是 PyTorch 模型的二進位權重文件,包含了訓練完成的模型參數。
special_tokens_map.json:這個 JSON 檔案描述了特殊標記(如[PAD]、[CLS]、[SEP]等)的映射和設定資訊。
tokenizer.json:此 JSON 檔案包含了有關標記器(tokenizer)的配置信息,用於將文字轉換為模型的輸入格式。
tokenizer_config.json:這個 JSON 檔案也包含有關標記器(tokenizer)的設定信息,通常與tokenizer.json檔案相關。
Training_args.bin:二進位訓練文件,包含訓練參數和訓練過程的配置資訊。它可以用於還原模型的設定。
vocab.txt:此文字檔案包含了模型訓練的詞彙表,包括模型期間遇到的所有詞彙。
但這些全部的檔案內容我們在使用時也會全部一起載入,基本上也不用太深入地去理解
Model card
在預設不去更動 Model card 的情況下,他會包含以下內容
模型的分數和效能等分數
訓練參數
訓練的過程
一些套件的版本
簡易的API
(這是我覺得最棒的地方,他這裡就可以直接試用看看模型的結果)
,下面的句子範例事之前訓練品牌和物品兩種的模型
參考資料
https://huggingface.co/davidliu1110/bert-base-chinese-david-ner/tree/main
留言
追蹤
檢舉
上一篇
Day 28 - NER 模型評估和驗證
下一篇
Day 30 - 建立 Gradio Demo App
系列文
30天從零開始學習NLP(自然語言處理)
共
30
篇
目錄
RSS系列文
訂閱系列文
5
人訂閱
26
Day 26 - NER 模型訓練 (1)
27
Day 27 - NER 模型訓練 (2)
28
Day 28 - NER 模型評估和驗證
29
Day 29 - NER 模型檔案內容
30
Day 30 - 建立 Gradio Demo App
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19855
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
防火牆fortinet只開放line 問題
Gem如何找到該功能?!我是Gemini付費使用者
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
熱門回答
防火牆fortinet只開放line 問題
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
熱門文章
ISC2 CC 證照考試筆記和影片
Cisco 300-415 ENSDWI 認證考試介紹(CCNP Enterprise 專項)
Agentic AI 開發實戰:我是如何設計 “Code + LLM” 混合架構,解決 AI品質不穩的問題?
VScode 開發應用系統專案(10) - Spring boot MVC 應用系統設計(1)
【資料治理實戰回憶錄】04. 拆解元數據 (下):讓資料「用起來」
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}