14.2%企業願意聘用大資料人才
Cloud Future Built Today
IT EXPLAINED 數位轉型攻略 VII
技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
24
0
AI & Data
嘗試在AI世界闖蕩
系列 第
24
篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-09 10:11:21
503 瀏覽
分享至
語言模型Language Model
一個模型透過對人類文字使用大量的學習後,一個能合理預測下一個詞句、能架構出順暢文句。
傳統主要的模型:N-gram、TF-IDF、Word2 Vector
大型語料庫訓練模型:ELMO、ULMfIT、GPT-2、XLM、BERT、GPT-3
BERT(Bidirectional Encoder Representations from Transformers)
Transformer的雙向編碼器。
一個基於微調Fine Tune、雙向Bidrection、多層Multi-Layer Transformer的Encoder。
利用無監督式學習的一個大型通用預訓練語言模式Pre-trained Language Model。
Google在2018年9月推出,為目前最有力的預訓練語言模式。
可以當成許多下游任務的基礎工程(利用BERT所學習到的高品質的詞向量來支援後面的下游任務)。
目前所有相關NLP任務的最有效率做法。
主要架構:利用Transformer的Encoder模組可分為:①BERT(Base):有12層,每層有12個Attention Head共有1.1一個參數。 ②BERT(Large):有24層,詞向量1024維度,每層有16個Attention Head,共有3.4一個參數。
訓練資料:包括Wikipedia+Bookcorpus(11038本)加上FB(Meta)共33億個字。
訓練方式:
➊詞層次Word Level的克漏字填空Masked Language Model(MLM):再輸入的文本中隨機掩蓋Mask每個句子中15%的詞,訓練由左右兩邊的詞句來預測中間被掩蓋的詞,如此訓練就可得到中間詞前後左右雙向的依賴關係Bidirection Relationship,並解決同詞異義的問題。
➋句子層次的下一句預測,即NSP(Next Sentence Prediction):許多任務,像是:問答系統、聊天機器人、詩詞創造,都需要語言模式具備此功能。在input的句子後下一個句子視為正確的正樣本Positive Sample,然後NSP再隨機由文本抽取一個其他句子視為錯誤的負樣本Negative Sample。
優勢:
①Transformer優勢:利用平行、聚焦、直接對應速度快的Transformer Model及其所具備的自我注意力機制優點。
②詞層次深入的理解詞意:利用MLM以及自我注意力SATT兩個重要機制。
③句子層次的深入了解句子與句子之間的關係:利用NSP Model。
④非監督式學習:採用成本低、獲取容易、可大量蒐集、不用標註、不用做預處理的一般通用語料。
主要貢獻、應用:
①取代傳統複雜的NLP預處理工作
②取代部份的下游任務的工作
特色:
🔼BERT以預訓練模式的方式支援各種不同的任務
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 23 AI核心應用:自然語言處理(AM、Transformer)
下一篇
Day 25 AI核心應用:自然語言處理(GPT-3、LM未來)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22211
篇
完賽人數
600
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
VMware remote console下載....
幼兒會亂按桌機開關關停桌機,奇怪以前的桌機需長按5秒才能關停,怎麼現在的桌機一按就關停了?請問有什麼方法或設定可以解決幼兒亂按關停桌機的問題.謝謝!!
公司大量報廢 3C 產品如何清理?
Kali Linux如何執行exe檔?
如何解決搜尋網址的摘要被導去垃圾站的問題?
用UE5做了遊戲,已經丟上google play封測中,想問怎麼串內購跟將遊戲存檔存在google帳戶
中小公司 郵件系統、人資系統 更換請益
如何宣告讓任何 IP 都能連線的資料庫 (WorkBench)
玩玩SQL~將備註敘述裡面的數字縮零調整~求SQL改善
請問有版友,能提供目前for HPE Server最新版本的esxi 8.0.3嗎?
Windows 10支援倒數,聯繫微軟夥伴諮詢
立即標記行事曆,7/2 探索 AI 與雲端的無限未來!
AI 賦能 DevOps,開啟創新應用!
GenAI 加速企業創新落地,更需要全新 IT 戰略
僅需 6~12週快速建立 GenAI 策略與路線圖
熱門回答
中小公司 郵件系統、人資系統 更換請益
幼兒會亂按桌機開關關停桌機,奇怪以前的桌機需長按5秒才能關停,怎麼現在的桌機一按就關停了?請問有什麼方法或設定可以解決幼兒亂按關停桌機的問題.謝謝!!
DNS內部轉指問題
HILINK VPN 連線 NAS
如何宣告讓任何 IP 都能連線的資料庫 (WorkBench)
熱門文章
什麼是高內聚與低耦合的程式架構?
Awesome Go Classroom Site
【讓機器人做】自動截取網頁資料 + 排程器篇 II
虛擬機安裝Windows11解決TPM及本機安裝問題
Cyber security -2 : Threat actor types
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}