大腦如何精準學習 (3) 錯誤回饋

2021 iThome 鐵人賽

DAY 29

自我挑戰組

開卷計劃：做一個高手夢系列第 29 篇

13th鐵人賽

Ellen Lee

團隊Outcome First 2.0

2021-10-14 22:18:32

2196 瀏覽

分享至

「錯誤」的定義

重複上章節對「好奇心」的心理假設：

大腦只有在感知到預測和實際認知有缺口時，才會啟動學習。
因此，如果不去發現錯誤，大腦就沒有學習。

在展開細節前，先澄清一下，這裡指的「錯誤」是指「大腦中流動的內在訊號」，而不是一定要在真實世界慘遭失敗。

「驚訝」是學習的驅力

著名的「狗聽到鈴聲會流口水」的制約實驗，把這個實驗背後的機制講清楚一點：

大腦計算感官輸入 (鈴聲) 的加權總值，作出了預測 (期待後面會有食物)
大腦計算這個預測，和實際刺激 (真的有食物) 的差別，
- 這個差別稱為「預測誤差 prediction error」，是理論的核心概
- prediction error 會測量每一次刺激帶來的驚訝程度
大腦會用這個驚訝訊號，校正內在表徵：
- 內在模式依刺激強度和預測誤差的比例作調整，使下一次的預測更接近真實性

簡言之，大腦用感官輸入時來預測後面刺激（食物）出現的機率。

延伸的意義是：

學習只有在大腦選擇恰當輸入（注意力）時，才會發生
大腦用「輸入」來產生預測（此即 active engagement）
並評估這些預測的正確性 (error feedback)

這些心理機制被運用在人工神經網路裡，在幾乎所有的 AI 學習監督系統中都有應用，也就是「對反應給予清楚明顯的回饋」。

在類神經網路中，學習就是降低不可預料性。大腦用 Input 來做預測，再根據驚訝、不可能性和錯誤程度來調整預測。

學習和聯結 (associative) 無關

在上述理論浮現之前，有很長一段時間，大家認為大腦的學習是聯結式的，學習是建立 A 和 B 的聯結，因此從 A 可以想到 B。

這些略過作者的陳述，總之，已有清楚的實驗證明，學習和 association 無關，和驚訝有關。

答對時，會有學習嗎？

會的，例如我們問一個你完全不知道的題目。畢卡索的 last name 是 Diego 還是 Rodrigo。

假設你猜 Diego，這時候你自信心很低。也就是你不確定。

而得到答案後，發現你竟然猜對了！此時的回饋還是會提供你的訊息！

你在亂猜時，答對機率是 50%；後來你才知道原來是 100%，這之間仍然有 50%的缺口。因此，你的大腦仍然會將訊號散播出去，並更新你的知識。

大腦 & 錯誤訊號 & 驚訝反應

大腦的所有區域可以送出且交換錯誤訊號。例如用音符 & 旋律的例子，

聽到音符 CCG 時，聽覺皮質送出一個低層次的錯誤訊號，因為 G 和 C 不同，所以產生驚訝反應
訊號到底高一點的層次時，判斷出了原來這個音符組合是「一閃一閃亮晶晶」的旋律，所以 G 引發的驚訝，在這個層次消失了
此時 G 沒有再往上激發下前額葉皮質的驚訝。

不過，如果改成 CCC 組合：

這個單調的組合，在下層的聽覺皮質區域，沒有引起任何的訊號
但在高一點的層次產生了驚訝，因為高層次知道有 CCG 組合，結果來了個 C

→ 只有得到「驚訝、出乎意料」的訊息時，才會被轉呈到高層次的皮質。

大腦的每個區域都有這種發射錯誤訊號的機制。

預測 & 期待

當你建立一個預測，「期待某件事發生」時，你的報酬迴路/多巴胺迴路產生了反應。

接下來，多巴胺迴路開始預測「會不會有錯誤」？如果你「預測自己會獲得報酬」，多巴胺也會起反應。

意思是：自己批判自己，也會有學習效果，不必等到外在世界給你回饋。

這是為什麼 AI 應用中，要解決複雜問題時，普遍會用第一個神經網路去批判另一個神經網路。

回饋不是處罰

我們不處罰 AI，我們只是告訴他哪裡錯了，並且放上標記。

後設分析清楚指出，回饋品質是決定成功的因素之一。

設立清楚的學習目標，並且讓學生慢慢達成。

錯誤回饋不是「應該要怎麼做」

有一個討論是「告訴學生『應該要怎麼做』，是不是討論告訴他們『做錯了』」

對於邏輯完美的人，上述狀況才會成立，邏輯完美人會知道在 A 選 B 的題目中，兩者的機率是 50%

但對孩子來說，對二選一的題目，他們不會明顯推論「選擇我選 A ，老師說我錯了，那麼正確答案就是 B」，但他們很容易就可以接收到「我做錯了」的訊息。

總之，對成人來說，報酬和處罰，兩者的訊息反應是等量的。而對青少年來說，因為青春期費洛蒙的影響，他們對報酬的期待遠大於錯誤。因此，對青少年溝通時，絕對不能混淆 error feedback 和處罰，一定要給予中性的回饋。

回饋一定要明確

「打分數」最大的問題，是因為他不明確，分數是一堆不同錯誤的總和，所以他的訊息度不明確，無法成功引發 error feedback 反應。

分數要伴隨詳細的評估，才會有效。

電玩設計中，當難度提高時，永遠會有「重新挑戰」的機制，但學校的體驗中，老師通常不會讓學生重新考試，而是在下一週追加新的習題。這種設計造成了災難。

數學焦慮徵候群

在「壞成績造成大腦情緒系統巨大傷害」的相關研究中，數學焦慮已經被大量測量，我們清楚看到痛苦和恐懼的神經迴路被活化了，和大腦深處的杏仁核建立連結，產生情緒海嘯，摧毀計算、短期記憶和學習的能力。

從老鼠的實驗中，我們更看到突觸凍結，形成僵硬的神經網路。

以上神經機制，對應到心理學說的 fixed mindset。反之則是 growth mindset.

要培養 growth mindset，在回饋時要避免指出「什麼是好」，需要建構獎勵的是

下苦功
試著說出自己的看法，即使錯了也沒關係
關注自己每天的進步

「考試」非常有效，前提是成功引發 error feedback 機制，不要引發處罰和莫名其妙的分數。

讀書 & 測驗穿插，效果最好

active engagement + error feedback，兩者混搭，效果最好。

花太多時間寫筆記、讀課本，但一直遲遲不測驗，效果會和「有做測驗」的組別差很多。

間隔效應

把訓練過程間隔開來，比一次集中的效果好 3 倍以上。

集中一次學習，會在重複中減低大腦活動。但分成很多天來學，則可以保持新奇感，也就是大腦的活化程度。

理想的間隔

關於理想的間隔，一種說法是「睡一覺以後」，

但比較仔細的心理研究認為，最佳間隔要看「你想要保留記憶多久」。例如想要記憶 10 個月，那每 2 個月拿出來溫習，效果最持久。

也就是 20% 長度間隔。

在有長期間隔後，重複溫習同一份資料，我們說服大腦「這份資料很重要，將來會用到」，此時，記憶的機制，會把記憶投射到未來。

上述研究很容易落實在課堂中。理論上，「從頭到尾溫習」的效果比較好，所以期末考優於月考，但在實踐上，期末考比較容易引發「臨時抱佛腳」，而不是「每天間隔溫習」，這是理想與現實的落差。

重複同樣的東西

一直重複同樣的東西，會學得更多嗎？→ 會，只要不確定性存在，就會產生學習。除非已經 100% 精通。不停重複才會形成固化(consolidation)，此時才會真正讓資訊進入潛意識，讓心智自動化。

大腦如何精準學習 (2) 積極主動參與/好奇心

大腦如何精準學習 (4) 固化

系列文

開卷計劃：做一個高手夢共 30 篇

RSS系列文訂閱系列文

7 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

iT邦新手 4 級 ‧ 2021-10-31 17:44:29

學習和 association 無關，和驚訝有關

這太令人驚訝了！

回應
檢舉

登入發表回應

我要留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

趣味SQL，給了一組編號後，用SQL產生亂數編碼的結果(更新Copilot及Google AI見解，SQL只能貼圖)

IT邦幫忙

開卷計劃：做一個高手夢系列 第 29 篇