技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
25
0
AI & Data
嘗試在AI世界闖蕩
系列 第
25
篇
Day 25 AI核心應用:自然語言處理(GPT-3、LM未來)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-10 12:37:33
382 瀏覽
分享至
GPT-3(Generative Pre-trained Transformer 3)
一個基於Transformer Decoder無監督式學習、單向、大型通用式的語言模型。
主要目標在於預測下一句最合理的詞句為任務。
大型GPT-3有1750億個參數,96層Transformer每層有128個Attention Head詞向量的維度為12288。
有各種大小。
訓練數據:來源有Common Crawl DataSet、Web Text、Book1、Book2、Wikipedia。
主要預測方式:
➊Zero Shot(不該有目標樣本):只是描述任務的特性,而不給任何的樣本而讓GPT-3自己去執行。
➋One Shot(只有一個目標樣本):只給一個下游任務的樣本Demo給GPT-3看,而它就要執行此任務。
➌Few Shot(只有少數目標樣本):只用10~100個目標任務的新樣本就可以執行許多下游的任務,而不需要改變原來語言模式內的所有參數權重,不需要做微調的工作。
應用:
1.句子的理解方面:由一個句子來預測最後一個字,主要是要測試其長距離的依賴關係與對句子結構的理解。
2.文本的理解方面:預測文本的結尾。
3.句子面的關係方面:測試其瞭解文本與句子的關係。
4.QA系統:直接在網頁大量的文章中、書本及維基的文本內直接抽取出正確的回答。
5.機器翻譯方面:對各國語言的翻譯。
6.常識與推理Common Sense Reasoning方面
7.閱讀瞭解Redding Compreshension方面:文本摘要、問答系統、聊天機器人。
8.在數學方面:二位數加減完全沒問題,三位數的正確率大約在80%~90%。
9.語意的瞭解方面:SAT的同詞異義與異詞同義正確比率維60%~65%。
10.創造新文本方面:給一個題目,可以寫出一篇文章。
11.句子生成方面:對沒見過的字簡單檢視並自我造句。
風險:
➊誤用的強力語言工具:對於詐騙集團、假消息、垃圾郵件、釣魚網站、論文造假如虎添翼。
➋垃圾進垃圾出:如果輸入的資料有歧視、不公正、辱罵等負面內容,則輸出的結果也會有這種偏差性的內容。
➌品質的問題:社群媒體上的內容品質不高,導致分析出來的內容有品質問題。
➍準確穩定性的問題:結果常出現荒謬錯誤或是專業領域沒經過微調,績效不穩定。
未來Language Moedl
趨勢會往下面幾個走:
更可控制的文本生成:要求文本的出處資料,保障input品質,避免Garbage in Garbage out(GIGO)。
綜合知識圖譜Knowledge Graph(KG)功能:用來清楚瞭解文句中的正確邏輯關係。
更好的道德風險分析:用道德規範的指標來比較不同LM的輸出品質、做倫理道德偏差內容的比較分析,來監督改善LM生成內容與品質符合人類的道德規範。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
下一篇
Day 26 AI核心應用:電腦聽覺與視覺(語音辨識)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22061
篇
完賽人數
594
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
7zip解壓問題
[急!] Exchange 系統管理中心 不小心停用了使用者信箱 要怎麼復原
有人公司做過資訊安全演練嗎
excel 如何利用寫入VBA 來做到一鍵執行 「清空剪貼簿」?
從合規的角度上來說微服務架構當前的壁壘是什麼
windows11 策略編輯器 軟體限制原則失效?
PYTHON 工具
對其他dns伺服器進行遞迴查詢失敗
有關於Plesk 記憶體使用 的疑惑
資料庫系統
熱門回答
7zip解壓問題
WIN11 一直跳出中毒的訊息
如何讓內網的FortiGate防火牆可以收到韌體更新與下載
PYTHON 工具
有關於Plesk 記憶體使用 的疑惑
熱門文章
PrintNightmare: 沒想到會被 Windows 11 終結
[系統設計]- 容易產生設計盲點
[Day 13] 資訊安全策略的制定與實施
新手入門:無伺服器函數和FaaS簡介
Day1 - 30天學習Python
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}