技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
23
0
AI & Data
嘗試在AI世界闖蕩
系列 第
23
篇
Day 23 AI核心應用:自然語言處理(AM、Transformer)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-08 18:51:03
242 瀏覽
分享至
注意力機制Attention Mechanism,簡稱AM**
是目前深度學習中非常重要的一個機制。
是個提升系統專注力的功能機制,可以架接在任何深度學習的模式上。
透過另一層網路參數來學習每個字與其上下文之間的權重加成。
直接聚焦在與他相關的輸入數據上來記憶與處理,對於不相關沒有影響力的其他訊息,則給予低權值(類似尋找資料的直接索引法)
例子: Emma chase Annie做英翻中時,Chase這個字應該聚焦在中文的追字,經過數萬次訓練後,機器已經學習好詞語詞對應關係,所以當下次要翻譯類似句子時,機器讀到Chase後,就能馬上升成一個Input與Output相關性的對照表。
特色、優點:
①聚焦,再生成輸出時,只聚焦與當前要輸出的字有相關性最大的個別輸入訊息。
②豐富性,對每個個別的輸入,都會提供一個背景向量Context Vector,提供了相對豐富的訊息。
③重要性,依賴每個詞不同的相關性、重要性,直接來對特徵值。
④正確率高,幫助ED Model正確掌握輸出與輸入的精確點對點對應關係,因此提升了NLP許多任務的精確性,特別是在超大文本的資料集上。
主要應用:
Transformer
基於EDmodel,加上自我注意力機制Self-Attention(SATT)的一種深度學習模式。
常被用於一種預訓練模式Pre-trained Model。
完全放棄了傳統RNN家族的架構,利用自我注意力機制SATT來取代相對複雜、序列性、速度慢、計算耗時的RNN架構。
逐漸成為NLP的主流模式,跨時代的典範轉移,產生跨時代的強大語言模型BERT。
架構圖:
應用:①機器翻譯:不同語言輸入詞與詞的對映關係 ②文本摘要:長文本與摘要間對映關係 ③QA系統:Q與A對映關係 ④語音辨識:語音訊息與文字的對應關係 ⑤Chatbot ⑥情緒分析:不同詞與情緒表示的對映關係
優點(與RNN比較):①平行處理 ②訊息豐富 ③個數少、複雜性低 ④重要性
自我注意力機制Self-Attention,簡稱SATT
利用源端的注意力機制Source Attention、目標端的注意力機制Target Attention與源端目標端交叉注意力機制Cross Attention三種ATT來擷取與輸出豐富的語意資訊,並在生成輸出時快速正確長我辭語詞之間應該聚焦對齊的各種關鍵訊息。
源端的注意力機制Source Attention:在輸入端能計算自己內部詞與詞之間的Attention來捕捉輸入內部訊息之間的依賴關係;對於句中每個字都平行獨立的去測量,依據輸入句子中其他字的關聯性大小,而賦予不同權重的一種注意力機制。
目標端的注意力機制Target Attention:輸出的目標端計算自己的Attention並捕捉輸出內部個個詞與詞的關係與重要性。
源端目標端交叉注意力機制Cross Attention:就是原本傳統Encoder與Decoder訊息的ATT,捕捉的是輸入序列的每個詞與輸出序列的每個詞之間的對應性與依賴關係。
因此相較於傳統機制,自我注意力機制多了兩個注意力。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 22 AI核心應用:自然語言處理(句向量、NLP)
下一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22061
篇
完賽人數
594
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
7zip解壓問題
[急!] Exchange 系統管理中心 不小心停用了使用者信箱 要怎麼復原
有人公司做過資訊安全演練嗎
excel 如何利用寫入VBA 來做到一鍵執行 「清空剪貼簿」?
從合規的角度上來說微服務架構當前的壁壘是什麼
PYTHON 工具
windows11 策略編輯器 軟體限制原則失效?
WIN11 一直跳出中毒的訊息
資料庫系統
如何讓內網的FortiGate防火牆可以收到韌體更新與下載
熱門回答
7zip解壓問題
WIN11 一直跳出中毒的訊息
如何讓內網的FortiGate防火牆可以收到韌體更新與下載
有關於Plesk 記憶體使用 的疑惑
PYTHON 工具
熱門文章
PrintNightmare: 沒想到會被 Windows 11 終結
[系統設計]- 容易產生設計盲點
[Day 13] 資訊安全策略的制定與實施
新手入門:無伺服器函數和FaaS簡介
Day1 - 30天學習Python
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}