iT邦幫忙

2025 iThome 鐵人賽

0

AI

  • 任務有Perception、Reasoning、Learning、Problem Solving、Decision-Making,AI是涵蓋多種技術的總稱(Umbrella Term)
  • 如果發生這件事,就做那件事

ML

  • 讓機器能自行從訓練資料中學習
  • Regression:透過計算出訓練資料的線性方程式,就能依照規律預測新的結果
  • Classification:資料在二維圖上,劃出一條特定的線,線左邊藍點資料較多;線右邊橘點資料較多
  • 見過很多相似的事物,並對它們進行分類

DL

  • 使用類似人腦的神經元與突觸來訓練模型
  • 過去沒見過某件事,但已經學習過許多相似的概念,因此可以做出決策

GenAI

  • 大量資料(unlabeled data)來預先訓練FM,再自備的資料透過fine-tuning以符合特定任務
  • 使用Transformer模型,使模型能夠一次處理整個句子。
  • Transformer核心概念是能夠在一句話中,為不同單詞分配相對的重要性(Attention)DAY23

Multi-modal Models

  • 不依賴單一類型的輸入(不限於文字、圖片)
  • 非單一類型的輸出,比如同時接收音訊、圖片與文字作為輸入,並輸出如影片與文字的混合結果

ML術語

  • GPT(Generative Pre-trained Transformer)
    根據輸入prompt生成文字或code
  • BERT(Bidirectional Encoder Representations from Transformers)
    與GPT的目標類似,但可從從兩個方向讀取文字,適合用於翻譯
  • RNN(Recurrent Neural Network)
    適用於序列資料如時間序列或文字,用於語音辨識、時間序列預測
  • ResNet(Residual Network)
    CNN,用於影像識別、物體偵測、臉部辨識
  • SVM(Support Vector Machine)
    用於分類和回歸的機器學習演算法
  • WaveNet
    用於生成原始音訊波形的模型,如語音合成
  • GAN(Generative Adversarial Network)
    用於生成類似訓練資料的合成數據,如影像、影片或聲音,有助於資料增強
  • XGBoost(Extreme Gradient Boosting)
    梯度提升演算法的一種實現

labeled data - 訓練資料同時包含輸入特徵與對應的輸出標籤,Supervised Learning
unlabeled data - 訓練資料僅包含輸入特徵,Unsupervised Learning
structured data - 資料以表格形式排列(tabular data);資料具有連續性時間收集或記錄(time series data)
unstructured data - 資料不遵循特定結構,通常以文字或多媒體內容為主,如文字和影像


上一篇
DAY 36 Amazon Q for QuickSight、EC2、Chatbot、Glue
系列文
找工作期間不要讓自己太廢37
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言