14.2%企業願意聘用大資料人才
Cloud Future Built Today
IT EXPLAINED 數位轉型攻略 VII
技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
23
0
AI & Data
嘗試在AI世界闖蕩
系列 第
23
篇
Day 23 AI核心應用:自然語言處理(AM、Transformer)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-08 18:51:03
668 瀏覽
分享至
注意力機制Attention Mechanism,簡稱AM**
是目前深度學習中非常重要的一個機制。
是個提升系統專注力的功能機制,可以架接在任何深度學習的模式上。
透過另一層網路參數來學習每個字與其上下文之間的權重加成。
直接聚焦在與他相關的輸入數據上來記憶與處理,對於不相關沒有影響力的其他訊息,則給予低權值(類似尋找資料的直接索引法)
例子: Emma chase Annie做英翻中時,Chase這個字應該聚焦在中文的追字,經過數萬次訓練後,機器已經學習好詞語詞對應關係,所以當下次要翻譯類似句子時,機器讀到Chase後,就能馬上升成一個Input與Output相關性的對照表。
特色、優點:
①聚焦,再生成輸出時,只聚焦與當前要輸出的字有相關性最大的個別輸入訊息。
②豐富性,對每個個別的輸入,都會提供一個背景向量Context Vector,提供了相對豐富的訊息。
③重要性,依賴每個詞不同的相關性、重要性,直接來對特徵值。
④正確率高,幫助ED Model正確掌握輸出與輸入的精確點對點對應關係,因此提升了NLP許多任務的精確性,特別是在超大文本的資料集上。
主要應用:
Transformer
基於EDmodel,加上自我注意力機制Self-Attention(SATT)的一種深度學習模式。
常被用於一種預訓練模式Pre-trained Model。
完全放棄了傳統RNN家族的架構,利用自我注意力機制SATT來取代相對複雜、序列性、速度慢、計算耗時的RNN架構。
逐漸成為NLP的主流模式,跨時代的典範轉移,產生跨時代的強大語言模型BERT。
架構圖:
應用:①機器翻譯:不同語言輸入詞與詞的對映關係 ②文本摘要:長文本與摘要間對映關係 ③QA系統:Q與A對映關係 ④語音辨識:語音訊息與文字的對應關係 ⑤Chatbot ⑥情緒分析:不同詞與情緒表示的對映關係
優點(與RNN比較):①平行處理 ②訊息豐富 ③個數少、複雜性低 ④重要性
自我注意力機制Self-Attention,簡稱SATT
利用源端的注意力機制Source Attention、目標端的注意力機制Target Attention與源端目標端交叉注意力機制Cross Attention三種ATT來擷取與輸出豐富的語意資訊,並在生成輸出時快速正確長我辭語詞之間應該聚焦對齊的各種關鍵訊息。
源端的注意力機制Source Attention:在輸入端能計算自己內部詞與詞之間的Attention來捕捉輸入內部訊息之間的依賴關係;對於句中每個字都平行獨立的去測量,依據輸入句子中其他字的關聯性大小,而賦予不同權重的一種注意力機制。
目標端的注意力機制Target Attention:輸出的目標端計算自己的Attention並捕捉輸出內部個個詞與詞的關係與重要性。
源端目標端交叉注意力機制Cross Attention:就是原本傳統Encoder與Decoder訊息的ATT,捕捉的是輸入序列的每個詞與輸出序列的每個詞之間的對應性與依賴關係。
因此相較於傳統機制,自我注意力機制多了兩個注意力。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 22 AI核心應用:自然語言處理(句向量、NLP)
下一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22206
篇
完賽人數
600
人
看影片追技術
看更多
資安新時代來臨:新想法、新規定、新管理-身分認證、掃描工具、資料保護的進化
臺灣資安大會
|
28 分
Code-Driven Development and Monitoring of Machine Learning Services on Kubernetes
Kubernetes Summit
|
38 分
建立協作高效工作流、開創多元創意生產力
IT EXPLAINED
|
40 分
衝出新手村,開發與維運的體驗進化之旅
DevOpsDays
|
22 分
從日本政府禁用 PPAP 談雲端資安威脅趨勢
Cloud Summit 臺灣雲端大會
|
29 分
SRE 如何實踐可視性告警
SRE CONFERENCE
|
20 分
大型語言模型應用與潛力:AI時代的學習起點
iThome鐵人賽
|
30 分
加速 AI 創新:在 Kubernetes 上構建可擴展、安全且高效的 AI 平台
Kubernetes Summit
|
29 分
2021 Q4 - Progress MFT 安全檔案傳輸管理軟體 - MOVEit Transfer 培訓課程
|
30 分
MOE 和 GPU 與 K8s 在服務網格上應用
Kubernetes Summit
|
31 分
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
關於備份 3-2-1 原則
用Outlook收Gmail的信
Fortigate 60E升級60F,設定檔通用嗎?
可不可以執行HTML檔案,裏面帶帳號及密碼然後連上網頁?
鼎新 Workflow ERP 資產負債表問題
Dell PowerEdge R430硬件更換問題
DHCP與LAN連線問題請益
更新後 會啥原本可以 用 PIN 登入 WINDOWS卻不行了
fortigate101F 中央控管一直在未納管
[.NET] 如何更新專案中的轉移套件?
AI 賦能 DevOps,開啟創新應用!
立即標記行事曆,7/2 探索 AI 與雲端的無限未來!
Windows 10支援倒數,聯繫微軟夥伴諮詢
GenAI 加速企業創新落地,更需要全新 IT 戰略
熱門回答
關於備份 3-2-1 原則
Fortigate 60E升級60F,設定檔通用嗎?
用Outlook收Gmail的信
Dell PowerEdge R430硬件更換問題
可不可以執行HTML檔案,裏面帶帳號及密碼然後連上網頁?
熱門文章
【Mikrotik RouterOS 系列1】QNAP Virtualization Station 工作站安裝及建置軟路由
二、三天學一點點 Rust:來!先從建立專案開始(1)
HTML 入門筆記 - 2 - HTML 架構與基礎語法
<tr>可以在後端做判斷做隱藏嗎.可以哦.來看看怎麼做
【徵才】資料工程講師|遠距授課、實務導向課程
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}