iT邦幫忙

2023 iThome 鐵人賽

DAY 2
0
AI & Data

我要成為AI溝通師!30天快速理解Prompt Engineering系列 第 2

DAY2-語言模型及生成式模型

  • 分享至 

  • xImage
  •  

語言模型

統計式的語言模型是一個詞序列上的機率分布,提供了上下文來區分那些聽起來相似的單詞和短語。語言模型常使用在許多自然語言處理方面的應用,由於字詞與句子都是任意組合的長度,導致語料庫在訓練模型時估算字串的機率變得很困難,因此將模型類型分成單元語法、n-元語法、指數型三個特性來分辨語言的特性。

淺談生成式模型

生成式模型是一種概率統計理論的機器學習,常常和判斷式模型做對比。生成式模型可直接對數據建模,也可以建立變量間的條件概率分布,體現更多數據本身的分布信息,收集同類數據的相似形情,普遍性更廣、收斂速度更快,生成和原始數據相似的新數據。生成式模型適用於無監督的任務,例如分類、聚類。典型的生成式模型有高斯混合模型、樸素貝葉斯分類器、隨機上下文無關文法。

生成?判別? 超級比一比

  1. 生成式模型特點:
    (1) 聯合概率分布建模,學習分類數據
    (2) 可反映數據本身的特性
    (3) 學習成本高
    (4) 所需樣本數多
    (5) 推斷性能差
    (6) 適合集群問題
    (7) 適用於非監督學習
    (8) 在特定條件下能轉換成判別式

  2. 判別式模型特點:
    (1) 條件概率模型,學習不同類別最優邊界
    (2) 無法反映數據本身特性
    (3) 學習成本低
    (4) 所需樣本數少
    (5) 預測性能好
    (6) 適合回歸問題
    (7) 適用於監督學習
    (8) 無法轉換成生成式模型

參考網站:
https://foncc.com/archives/30865
https://zh.wikipedia.org/zh-tw/%E7%94%9F%E6%88%90%E6%A8%A1%E5%9E%8B
https://zh.wikipedia.org/zh-tw/%E5%88%A4%E5%88%AB%E6%A8%A1%E5%9E%8B
https://www.vasatech.com.tw/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E4%B8%AD%E7%9A%84%E5%88%A4%E5%88%A5%E5%BC%8F%E6%A8%A1%E5%9E%8B%E5%92%8C%E7%94%9F%E6%88%90%E5%BC%8F%E6%A8%A1%E5%9E%8B/


上一篇
DAY1-Prompt Engineering的重要性及應用
下一篇
DAY3-探索GPT-3等語言模型的特點及應用情景
系列文
我要成為AI溝通師!30天快速理解Prompt Engineering30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
hlb
iT邦新手 5 級 ‧ 2023-11-04 12:05:09

請問「將模型類型分成單元語法、n-元語法、指數型三個特性」的「指數型」指的是什麼呢?

我要留言

立即登入留言