人工智慧 (AI) 是當前科技界的熱門話題,但許多人對它的理解還存在著廣泛的誤區和模糊認知。以我的工作經驗為例,我常發現市調研究報告顯示 AI 產品的年複合成長率 (CAGR) 顯著高於其他資訊或科技產業。然而,當我深入分析這些所謂的 「AI」 產品時,卻發現它們更多的是資訊化產品,而非真正的 AI 技術。比如,純資訊軟體或物聯網 (IoT) 產品,常常被錯誤地冠以 「AI」 的光環,只因為它們具有一定的自動化和效率提升功能,且是透過寫程式碼完成的。但事實上,這些系統並不具備 AI 系統最核心的自我 「學習」 能力。在一般大眾的心目中,AI 似乎變成了一個籠統的概念,凡是涉及自動化、提高效率或 「省時」 的技術,都被等同於 AI。但事實並非如此,AI 的定義及範疇遠比想像中更為專精和嚴格。
AI 的核心不只是自動化或程式設計,而是讓系統能夠 從數據中學習和進化,不斷提升判斷和決策的準確性。 一個真正的AI系統,必須能夠 持續地從數據中吸取經驗,自我改進,提升智能水準。 不像傳統程式設計需要人工硬性地將規則寫入程式碼。只要有足夠的歷史數據,AI 就能夠進行自我學習。
AI 領域可以大致分為四大類:深度學習 (DL)、自然語言處理 (NLP) 、機器學習 (ML) 和強化學習 (RL)。
深度學習 Deep Learning (DL):
深度學習是一種基於人工神經網絡的技術,主要用於圖像生成和識別。這些神經網絡通常包含多層,可以模擬人腦的學習過程。例如,深度學習技術可以應用於圖像分類、物體檢測、人臉識別等領域,甚至能夠生成逼真的圖像。
自然語言處理 Natural Language Processing (NLP):
自然語言處理專注於文字生成和理解,旨在使計算機能夠理解和產生人類語言。NLP 技術包括語音識別、語言翻譯、文本摘要、情感分析等。這些技術應用廣泛,例如智能客服、語音助理(如 Siri 和 Alexa)以及自動翻譯工具。
機器學習 Machine Learning (ML):
機器學習是一個更廣泛的領域,涵蓋了多種算法和技術,通過數據模型進行預測和決策。機器學習算法可以根據數據進行訓練,並在新數據出現時做出預測。常見應用包括分類、迴歸、聚類分析等。這些技術在金融市場預測、醫療診斷、推薦系統等方面發揮重要作用。
強化學習 Reinforcement Learning (RL):
強化學習是一種通過獎勵和懲罰機制來學習策略的技術,主要應用於策略決策系統。例如,AlphaGo 使用強化學習技術,在與人類對手和其他 AI 系統的圍棋對戰中不斷學習和改進自己的策略。強化學習在遊戲、機器人控制、自動駕駛等領域有著重要應用。
近期,生成式 AI 成為新的熱點。生成式人工智慧 (Generative AI,GAI) 技術主要涉及生成新數據,如文本、圖像和音樂等。這些技術大多基於深度學習模型。例如,GPT-3.5 可以生成與人類寫作風格相似的文章,DALL-E 可以根據描述生成圖像,Stable Diffusion 則能夠渲染出高質量的圖像。Suno 開發的生成式 AI 技術可以根據輸入文本自動生成音樂,這些技術在創意產業、內容創作、自動化設計等方面皆展示了巨大的潛力。
作為剛從大學數學統計系畢業兩年並專攻機器學習的我,深知這個領域的知識來源繁多,但卻缺乏系統性。許多資源要麼過於簡單草率,難以形成整體理解;要麼過於偏重數學理論,讓人難以將其應用到實際場景中。導致大家往往是東拼西湊,局部掌握某些概念,卻難以將它們有連貫性的串聯且掌握 ML 的全貌,進而在解決實際問題時感到無從下手,無法建立一個完整的知識體系。
我親身體會過這種困惑和疏離感。許多身邊朋友都曾詢問我關於 AI 的定義和內涵,也向我提到市面上的書籍大多偏向數學導論,缺乏具體的實作應用,不知該如何下手學習一個 ML 完整體系。我希望通過這個 30 天的系列文章,從基本概念開始,深入探討數據預處理、特徵工程、模型選擇與優化等環節,幫助讀者系統化地掌握機器學習,無論是新手還是有基礎的讀者,都能在這裡找到實用的知識。