技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
25
0
AI & Data
嘗試在AI世界闖蕩
系列 第
25
篇
Day 25 AI核心應用:自然語言處理(GPT-3、LM未來)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-10 12:37:33
402 瀏覽
分享至
GPT-3(Generative Pre-trained Transformer 3)
一個基於Transformer Decoder無監督式學習、單向、大型通用式的語言模型。
主要目標在於預測下一句最合理的詞句為任務。
大型GPT-3有1750億個參數,96層Transformer每層有128個Attention Head詞向量的維度為12288。
有各種大小。
訓練數據:來源有Common Crawl DataSet、Web Text、Book1、Book2、Wikipedia。
主要預測方式:
➊Zero Shot(不該有目標樣本):只是描述任務的特性,而不給任何的樣本而讓GPT-3自己去執行。
➋One Shot(只有一個目標樣本):只給一個下游任務的樣本Demo給GPT-3看,而它就要執行此任務。
➌Few Shot(只有少數目標樣本):只用10~100個目標任務的新樣本就可以執行許多下游的任務,而不需要改變原來語言模式內的所有參數權重,不需要做微調的工作。
應用:
1.句子的理解方面:由一個句子來預測最後一個字,主要是要測試其長距離的依賴關係與對句子結構的理解。
2.文本的理解方面:預測文本的結尾。
3.句子面的關係方面:測試其瞭解文本與句子的關係。
4.QA系統:直接在網頁大量的文章中、書本及維基的文本內直接抽取出正確的回答。
5.機器翻譯方面:對各國語言的翻譯。
6.常識與推理Common Sense Reasoning方面
7.閱讀瞭解Redding Compreshension方面:文本摘要、問答系統、聊天機器人。
8.在數學方面:二位數加減完全沒問題,三位數的正確率大約在80%~90%。
9.語意的瞭解方面:SAT的同詞異義與異詞同義正確比率維60%~65%。
10.創造新文本方面:給一個題目,可以寫出一篇文章。
11.句子生成方面:對沒見過的字簡單檢視並自我造句。
風險:
➊誤用的強力語言工具:對於詐騙集團、假消息、垃圾郵件、釣魚網站、論文造假如虎添翼。
➋垃圾進垃圾出:如果輸入的資料有歧視、不公正、辱罵等負面內容,則輸出的結果也會有這種偏差性的內容。
➌品質的問題:社群媒體上的內容品質不高,導致分析出來的內容有品質問題。
➍準確穩定性的問題:結果常出現荒謬錯誤或是專業領域沒經過微調,績效不穩定。
未來Language Moedl
趨勢會往下面幾個走:
更可控制的文本生成:要求文本的出處資料,保障input品質,避免Garbage in Garbage out(GIGO)。
綜合知識圖譜Knowledge Graph(KG)功能:用來清楚瞭解文句中的正確邏輯關係。
更好的道德風險分析:用道德規範的指標來比較不同LM的輸出品質、做倫理道德偏差內容的比較分析,來監督改善LM生成內容與品質符合人類的道德規範。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
下一篇
Day 26 AI核心應用:電腦聽覺與視覺(語音辨識)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22205
篇
完賽人數
602
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
要怎知道LINE使用者的使用地址
防火牆互通問題
Cisco 防火牆密碼確認正確,可是無法登入
outlook無法收發信
桌面的使用者文件圖標壞掉
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
小公司 兩台Win Server執行 AD Server ,更新電腦後,需要再多加一組Linux 作業系統來運行資料庫採集
bat檔截斷問題
一開機就自動鎖定帳戶
Palo alto防火牆網頁解密問題?
熱門回答
防火牆互通問題
outlook無法收發信
if函數中的>&<&=是否可以使用儲存格代替
Palo alto防火牆網頁解密問題?
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
熱門文章
每日一篇學習筆記 直到我做完專題 :( [Day5]
每日一篇學習筆記 直到我做完專題 :( [Day6]
每日一篇學習筆記 直到我做完專題 :( [Day7]
每日一篇學習筆記 直到我做完專題 :( [Day8]
遷入 Linode 的必備指南:最佳實務助您輕鬆上雲!
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}