2025 臺灣資安大會 限定好禮
IT EXPLAINED 數位轉型攻略 VII
號召DevOps專家立即投稿
技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
29
0
自我挑戰組
30天從零開始學習NLP(自然語言處理)
系列 第
29
篇
Day 29 - NER 模型檔案內容
15th鐵人賽
ner模型
模型檔案
huggingface
肉彈
2023-10-14 16:30:51
408 瀏覽
分享至
這篇我使用我之前上傳到 Hugging Face 的模型檔案來解說,那因為在模型訓練那部份我沒講到要如何上傳模型,因此等鐵人賽結束後我會再補充回去。
介紹兩個重要的部分 (先來說最重要的)
files : 模型的檔案
README.md:README 文件包含了模型的基本資訊,有關模型的描述性文件。
config.json:包含了有關模型配置的 JSON 檔案。它描述了模型的架構、超參數和其他配置資訊。
pytorch_model.bin:這是 PyTorch 模型的二進位權重文件,包含了訓練完成的模型參數。
special_tokens_map.json:這個 JSON 檔案描述了特殊標記(如[PAD]、[CLS]、[SEP]等)的映射和設定資訊。
tokenizer.json:此 JSON 檔案包含了有關標記器(tokenizer)的配置信息,用於將文字轉換為模型的輸入格式。
tokenizer_config.json:這個 JSON 檔案也包含有關標記器(tokenizer)的設定信息,通常與tokenizer.json檔案相關。
Training_args.bin:二進位訓練文件,包含訓練參數和訓練過程的配置資訊。它可以用於還原模型的設定。
vocab.txt:此文字檔案包含了模型訓練的詞彙表,包括模型期間遇到的所有詞彙。
但這些全部的檔案內容我們在使用時也會全部一起載入,基本上也不用太深入地去理解
Model card
在預設不去更動 Model card 的情況下,他會包含以下內容
模型的分數和效能等分數
訓練參數
訓練的過程
一些套件的版本
簡易的API
(這是我覺得最棒的地方,他這裡就可以直接試用看看模型的結果)
,下面的句子範例事之前訓練品牌和物品兩種的模型
參考資料
https://huggingface.co/davidliu1110/bert-base-chinese-david-ner/tree/main
留言
追蹤
檢舉
上一篇
Day 28 - NER 模型評估和驗證
下一篇
Day 30 - 建立 Gradio Demo App
系列文
30天從零開始學習NLP(自然語言處理)
共
30
篇
目錄
RSS系列文
訂閱系列文
5
人訂閱
26
Day 26 - NER 模型訓練 (1)
27
Day 27 - NER 模型訓練 (2)
28
Day 28 - NER 模型評估和驗證
29
Day 29 - NER 模型檔案內容
30
Day 30 - 建立 Gradio Demo App
完整目錄
直播研討會
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22199
篇
完賽人數
600
人
看影片追技術
看更多
打造敏捷團隊:在付得起的範圍內,瘋狂改變
Agile Summit 敏捷高峰會
|
40 分
行動身分識別新趨勢 線上說明會
全景軟體 - 專注於人、事、物認證
|
77 分
盤查流程化:建構線上碳流資訊平台的重要性
數位永續高峰會
|
31 分
從真實雲端資安攻防經驗,談零信任架構
Cloud Summit 臺灣雲端大會
|
26 分
生成式AI應用大爆發,利用AI實現IT自動化觸手可及
IT EXPLAINED
|
40 分
實戰 Angualr Signals
MWC
|
39 分
前端可觀測性 - Grafana 在下的一盤大棋
DevOpsDays
|
27 分
NetApp 幫助您建構混合雲最佳藍圖,強化資料管理
Cloud Summit 臺灣雲端大會
|
28 分
Azure Red Hat OpenShift 協助企業加速創新
IT EXPLAINED
|
48 分
X-FORT 讓端點防護成為資料最強堡壘
精品科技 ─ 捍衛您的資料堡壘
|
31 分
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
可靠安全的挖礦
尋求穩定Mesh建議
2025年 MIS的天花板在哪?
內部Windows DNS Server設定請教
請問以下網路情況如何追查或關閉異常設備?
批次刪除超過7天檔案及空資料夾問題
Redmine 如何簡單安裝在Win7作業系統上
台語語音模型 (STT, TTS)
outlook for mac 相關問題請敎
Windows 10 22H2訪問共享盤,提示錯誤碼:0x80070035
Windows 10支援倒數,聯繫微軟夥伴諮詢
【好禮等你拿】親臨現場,CYBERSEC 2025精美好禮帶回家!!
DevOps專家看過來!投稿開放至2/27,立即行動分享技術實力!
【免費線上報名】亞洲最大資安展:2025 臺灣資安大會
GenAI 加速企業創新落地,更需要全新 IT 戰略
熱門回答
尋求穩定Mesh建議
2025年 MIS的天花板在哪?
可靠安全的挖礦
求救~excel計算平均後,小數點進位,但加總後不能超過原本總額。
Redmine 如何簡單安裝在Win7作業系統上
熱門文章
有什麼端點防護方法?可以避免不斷更新的惡意入侵
淺談WIFI的運作原理 - 每天都在用的你又知道它多少?
PTT爬蟲 - 表特版
EasyFlow簽核問題
Senior Java Engineer 基礎技術筆試 (英文)
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}