第 5 天：生成式 AI 是怎麼誕生的？

2024 iThome 鐵人賽

DAY 5

生成式 AI

從 0 到 1 學習生成式 AI 模型建立以及 Prompt 技巧系列第 5 篇

16th鐵人賽

John Wu

2024-08-27 08:56:54

923 瀏覽

分享至

生成式 AI 是怎麼訓練的？

在開始使用 AI 前，要先理解我們現在使用的 AI 工具，像是 ChatGPT, Claude 等他們是怎麼被製造出來的

我想大家小時候應該都有玩過造樣造句，這是一輛 __ 的火車，這個空格就是讓我們想像的空間，填入什麼詞都可以，但也會有更合適的詞。這也是生成式 AI 運作的概念。

我們會有一些你想要訓練的資料，這時候你會需要一個邏輯系統來幫你訓練程式，讓他知道上下文怎麼銜接會比較合理，像是「我」＿「你」，中間放「愛」或是「喜」哪一個比較通順，我們就會透過一套評分系統讓程式知道說「愛」的分數比「喜」還要高，因此這個位子應該要填入「愛」，這個過程也是俗稱的「機器學習」。

我們可以說主要分成四大過程：「資料收集 & 清理」>「機器學習訓練」>「調整參數」>「模型部署」

但詳細的話可以拆成主要的 11 個過程：

1. 數據收集 (Data Collection)

收集大量相關的原始數據，這些數據可以來自各種來源，如傳感器、網絡、數據庫等。數據的質量和數量對最終模型的性能有很大影響。

2. 數據清理 (Data Cleaning)

原始數據通常包含噪聲、缺失值和不一致之處。因此，需要進行數據清理，包括去除噪聲、處理缺失值、標準化數據等，以確保數據質量。

3. 數據標記 (Data Labeling)

對數據進行標記，即給數據添加標籤。這一步驟對於監督學習特別重要。標籤可以由人工添加，也可以使用自動化工具進行標記。

4. 數據集劃分 (Data Splitting)

將數據集分成訓練集（Training Set）、驗證集（Validation Set）和測試集（Test Set）。通常，訓練集用於訓練模型，驗證集用於調參和模型選擇，測試集用於最終評估模型性能。

5. 特徵工程 (Feature Engineering)

從原始數據中提取有用的特徵，這一步驟包括特徵選擇、特徵轉換、特徵縮放等。好的特徵工程能顯著提升模型的性能。

6. 模型選擇 (Model Selection)

選擇適合的機器學習或深度學習模型。常見的模型包括決策樹、隨機森林、支持向量機、神經網絡等。不同的問題需要不同的模型。

7. 模型訓練 (Model Training)

使用訓練集數據對選定的模型進行訓練，這過程中模型會學習數據中的模式和規則。

8. 模型調參 (Hyperparameter Tuning)

調整模型的超參數以提升模型性能。這一步通常使用驗證集進行交叉驗證，以選擇最佳的超參數組合。

9. 模型評估 (Model Evaluation)

使用測試集評估模型的性能。常見的評估指標包括準確率、精確率、召回率、F1 分數等。

10. 模型部署 (Model Deployment)

將訓練好的模型部署到生產環境中，以便進行實際應用。這包括將模型集成到應用系統中，並確保其能夠在實際情況下正常運行。

11. 模型監控和維護 (Model Monitoring and Maintenance)

監控模型在生產環境中的表現，及時發現和解決問題，並定期對模型進行更新和重新訓練，以保持其性能和準確性。

接下來就跟著我每天認識 AI 的訓練過程，了解怎麼訓練出自己的專屬 AI 吧！

第 4 天：什麼是生成式 AI ？

第 6 天：模型訓練第一步｜數據收集

系列文

從 0 到 1 學習生成式 AI 模型建立以及 Prompt 技巧共 30 篇

RSS系列文訂閱系列文

5 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

從 0 到 1 學習生成式 AI 模型建立以及 Prompt 技巧系列 第 5 篇