iT邦幫忙

2025 iThome 鐵人賽

DAY 1
0
佛心分享-IT 人自學之術

學習 LLM系列 第 1

Day1 了解 LLM

  • 分享至 

  • xImage
  •  
  1. 什麼是 LLM
    • LLM (large language model) 是大型語言模型
    • 一種基於人工智慧技術的自然語言處理(NLP)模型
    • 透過深度學習技術,特別是神經網路架構(如 Transformer),在大量文本數據上進行訓練
      • 深度學習:機器學習(無需明確指令即可學習的統計演算法)的一種
        透過神經網路來學習識別模式並在原始的非結構化資料中進行關聯
      • 神經網路:由相互連接的節點組成
        • 這些節點分佈在至少三層:
          1. 輸入層
          2. 輸出層
          3. 一個或多個隱藏層
      • Transformer:
        • 基於自注意力機制(self-attention mechanism)的一種架構
        • 將輸入序列轉換或變更為輸出序列,透過學習內容並追蹤序列元件之間的關係來做到
        • 能夠在處理序列數據時,同時考慮序列中的所有元素
        • 模型不需要按順序逐步處理資訊,而是可以平行處理,大大加快了學習速度

2.LLM 的特點與能力
1. 語言理解
2. 文字生成
3. 翻譯與多語言支持
4. 知識整合
5. 對話能力
6. 任務適應性

3.優勢
1. 高效
2. 多功能
3. 持續進化

4.侷限
1. 知識限制
2. 缺乏真實理解
3. 倫理與偏見
4. 資源需求

5.應用
1. 商業
2. 教育
3. 醫療
4. 創意產業
5. 技術開發
6. 個人助理


下一篇
Day2 準備與安裝實作 LLM 所需環境
系列文
學習 LLM4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言