Deep Learning(深度學習),是人工智慧(AI)領域中的一個重要分支。模仿人腦神經網路的結構,讓電腦能自動學習並提取資料中的特徵,進而做出判斷或預測。特別擅長處理大量、複雜、非結構化的資料,例如影像、語音、文字等,因此在圖像辨識、語音助理、自動駕駛等領域大放異彩。
透過大量神經網路的訓練,深度學習讓電腦系統具備了幾項接近人類的感知能力:
這些能力,也正是 HCI 所需要的。
HCI,全名 Human-Computer Interaction(人機互動),是探討「人如何與電腦溝通」的一門跨領域科學,結合了心理學、設計學、資訊科學與工程學。核心目標是讓電腦系統不僅功能強大,更要「好用、直觀、貼近人性」,因此廣泛應用於介面設計、使用者體驗(UX)、虛擬實境(VR/AR)、智慧助理與可穿戴裝置等領域。
HCI 關心的是:
• 使用者怎麼與系統互動?
• 系統怎麼給出適當又即時的回饋?
• 電腦系統是否能理解人的需求與情緒?
HCI 涉及的面向非常廣,從早期的鍵盤滑鼠、GUI 使用者介面,到觸控、手勢、語音、甚至腦波與情緒辨識,都是 HCI 的研究與應用範疇。
過去的人機互動,大多仰賴鍵盤、滑鼠、觸控等明確的輸入方式,但隨著深度學習的導入,電腦系統能夠從影像、語音、手勢、情緒甚至腦波中自動提取訊息,理解使用者的需求與情境。
這種結合帶來的轉變:
例如:
• 影像辨識 + HCI → 透過手勢控制、臉部表情識別,讓使用者不用碰到鍵盤也能與系統互動。
• 語音辨識 + HCI → 智慧助理可以理解自然語言,回應更貼近人類對話。
• 情緒分析 + HCI → 系統能根據使用者的情緒或語氣調整互動方式,提升使用體驗。
這讓人機互動從「命令與回應」進化為「感知與理解」。
人機互動的未來,不只是輸入與輸出、控制與反應,而是理解與共感。深度學習讓電腦系統具備了這樣的起點,不只改變了我們與技術的關係,也開啟了嶄新的互動可能。這 30 天的旅程,也將從「理解」開始,一起探索感知與互動的邊界。