這一篇文章,我們將正式進入 AI 的領域,從簡單開始,逐步深入解釋。無論你是 AI 的新手,還是已經有一定基礎的專家,都能從中找到值得學習的內容。如果你已經熟悉這個領域,可以直接跳到你感興趣的部分。
讓我們從最基礎的問題開始:為什麼 AI 具備如此強大的能力?機器學習又是什麼?
其實,AI 的原理可以用我們在小學學到的方程式來解釋,例如:
y = ax + b
想像你正在解一個國小數學題目:
當 x = 1 時,y = 12;當 x = 2 時,y = 20。求 a 和 b 的值。
通過代入法,我們可以得到:
a = 8
b = 4
AI 的工作原理與這個例子非常相似,只不過它要處理的未知數是數十億甚至數百億個變量。這樣的問題變得更加複雜,例如:
當 x 是一張貓的圖片時,y = 貓。
當 x 是一張狗的圖片時,y = 狗。
透過「解未知數」,我們就能得到一個可以辨識物體的方程式。這就是現代人工智慧的核心思想——通過大量的訓練數據,找到可以解決問題的方程式。
當然,實際上的算法、模型和處理過程遠比這簡單的方程式複雜得多。如果你對這個領域感興趣,可以參考生成式 AI 導論 2024來進一步學習。
了解了 AI 的基本原理後,我們來聊聊生成式 AI。
早期的 AI 技術主要應用於辨識、分類和預測等已知問題的解決。而生成式 AI 則是一種可以根據輸入的指令,創造出全新內容的技術。以下是幾個例子:
大型語言模型(LLM)可以理解成手機上的自動選字功能的進階版。當你打字時,手機會根據已輸入的詞推薦下一個可能的詞。LLM 也是這樣工作,只是它學習了海量的文本資料,能做出更加複雜和智慧的預測。
LLM 是透過「閱讀」大量的資料來學習語言,它並不像人類那樣真正「理解」語言,而是依據統計來預測應該出現的詞。例如,你輸入「今天天氣真」,它會根據數據預測「好」這個詞最有可能出現。
當這種「自動選字」模型的規模擴大到數百億個參數,並且經過複雜的訓練,它就能呈現出類似智慧的行為,能夠寫文章、詩詞,甚至生成程式碼。
這篇文章希望能讓你對 LLM 有更深入的理解。
接下來我們會開始實際操作 LLM