iT邦幫忙

2021 iThome 鐵人賽

DAY 29
0
自我挑戰組

開卷計劃:做一個高手夢系列 第 29

大腦如何精準學習 (3) 錯誤回饋

  • 分享至 

  • xImage
  •  

「錯誤」的定義

重複上章節對「好奇心」的心理假設:

  • 大腦只有在感知到預測實際認知缺口時,才會啟動學習。
  • 因此,如果不去發現錯誤,大腦就沒有學習。

在展開細節前,先澄清一下,這裡指的「錯誤」是指「大腦中流動的內在訊號」,而不是一定要在真實世界慘遭失敗。

「驚訝」是學習的驅力

著名的「狗聽到鈴聲會流口水」的制約實驗,把這個實驗背後的機制講清楚一點:

  • 大腦計算感官輸入 (鈴聲) 的加權總值,作出了預測 (期待後面會有食物)
  • 大腦計算這個預測,和實際刺激 (真的有食物) 的差別,
    • 這個差別稱為「預測誤差 prediction error」,是理論的核心概
    • prediction error 會測量每一次刺激帶來的驚訝程度
  • 大腦會用這個驚訝訊號,校正內在表徵:
    • 內在模式依刺激強度和預測誤差的比例作調整,使下一次的預測更接近真實性

簡言之,大腦用感官輸入時來預測後面刺激(食物)出現的機率

延伸的意義是:

  • 學習只有在大腦選擇恰當輸入(注意力)時,才會發生
  • 大腦用「輸入」來產生預測(此即 active engagement)
  • 並評估這些預測的正確性 (error feedback)

這些心理機制被運用在人工神經網路裡,在幾乎所有的 AI 學習監督系統中都有應用,也就是「對反應給予清楚明顯的回饋」。

在類神經網路中,學習就是降低不可預料性。大腦用 Input 來做預測,再根據驚訝、不可能性和錯誤程度來調整預測。

學習和聯結 (associative) 無關

在上述理論浮現之前,有很長一段時間,大家認為大腦的學習是聯結式的,學習是建立 A 和 B 的聯結,因此從 A 可以想到 B。

這些略過作者的陳述,總之,已有清楚的實驗證明,學習和 association 無關,和驚訝有關。

答對時,會有學習嗎?

會的,例如我們問一個你完全不知道的題目。畢卡索的 last name 是 Diego 還是 Rodrigo。

假設你猜 Diego,這時候你自信心很低。也就是你不確定。

而得到答案後,發現你竟然猜對了!此時的回饋還是會提供你的訊息!

你在亂猜時,答對機率是 50%;後來你才知道原來是 100%,這之間仍然有 50%的缺口。因此,你的大腦仍然會將訊號散播出去,並更新你的知識。

大腦 & 錯誤訊號 & 驚訝反應

大腦的所有區域可以送出且交換錯誤訊號。例如用音符 & 旋律的例子,

  • 聽到音符 CCG 時,聽覺皮質送出一個低層次的錯誤訊號,因為 G 和 C 不同,所以產生驚訝反應
  • 訊號到底高一點的層次時,判斷出了原來這個音符組合是「一閃一閃亮晶晶」的旋律,所以 G 引發的驚訝,在這個層次消失了
  • 此時 G 沒有再往上激發下前額葉皮質的驚訝。

不過,如果改成 CCC 組合:

  • 這個單調的組合,在下層的聽覺皮質區域,沒有引起任何的訊號
  • 但在高一點的層次產生了驚訝,因為高層次知道有 CCG 組合,結果來了個 C

→ 只有得到「驚訝、出乎意料」的訊息時,才會被轉呈到高層次的皮質。

大腦的每個區域都有這種發射錯誤訊號的機制。

預測 & 期待

當你建立一個預測,「期待某件事發生」時,你的報酬迴路/多巴胺迴路產生了反應。

接下來,多巴胺迴路開始預測「會不會有錯誤」?如果你「預測自己會獲得報酬」,多巴胺也會起反應。

意思是:自己批判自己,也會有學習效果,不必等到外在世界給你回饋。

這是為什麼 AI 應用中,要解決複雜問題時,普遍會用第一個神經網路去批判另一個神經網路。

回饋不是處罰

我們不處罰 AI,我們只是告訴他哪裡錯了,並且放上標記。

後設分析清楚指出,回饋品質是決定成功的因素之一。

設立清楚的學習目標,並且讓學生慢慢達成。

錯誤回饋不是「應該要怎麼做」

有一個討論是「告訴學生『應該要怎麼做』,是不是討論告訴他們『做錯了』」

對於邏輯完美的人,上述狀況才會成立,邏輯完美人會知道在 A 選 B 的題目中,兩者的機率是 50%

但對孩子來說,對二選一的題目,他們不會明顯推論「選擇我選 A ,老師說我錯了,那麼正確答案就是 B」,但他們很容易就可以接收到「我做錯了」的訊息。

總之,對成人來說,報酬和處罰,兩者的訊息反應是等量的。而對青少年來說,因為青春期費洛蒙的影響,他們對報酬的期待遠大於錯誤。因此,對青少年溝通時,絕對不能混淆 error feedback 和處罰,一定要給予中性的回饋。

回饋一定要明確

「打分數」最大的問題,是因為他不明確,分數是一堆不同錯誤的總和,所以他的訊息度不明確,無法成功引發 error feedback 反應。

分數要伴隨詳細的評估,才會有效。

電玩設計中,當難度提高時,永遠會有「重新挑戰」的機制,但學校的體驗中,老師通常不會讓學生重新考試,而是在下一週追加新的習題。這種設計造成了災難。

數學焦慮徵候群

在「壞成績造成大腦情緒系統巨大傷害」的相關研究中,數學焦慮已經被大量測量,我們清楚看到痛苦和恐懼的神經迴路被活化了,和大腦深處的杏仁核建立連結,產生情緒海嘯,摧毀計算、短期記憶和學習的能力。

從老鼠的實驗中,我們更看到突觸凍結,形成僵硬的神經網路。

以上神經機制,對應到心理學說的 fixed mindset。反之則是 growth mindset.

要培養 growth mindset,在回饋時要避免指出「什麼是好」,需要建構獎勵的是

  • 下苦功
  • 試著說出自己的看法,即使錯了也沒關係
  • 關注自己每天的進步

「考試」非常有效,前提是成功引發 error feedback 機制,不要引發處罰和莫名其妙的分數。

讀書 & 測驗穿插,效果最好

active engagement + error feedback,兩者混搭,效果最好。

花太多時間寫筆記、讀課本,但一直遲遲不測驗,效果會和「有做測驗」的組別差很多。

間隔效應

把訓練過程間隔開來,比一次集中的效果好 3 倍以上。

集中一次學習,會在重複中減低大腦活動。但分成很多天來學,則可以保持新奇感,也就是大腦的活化程度。

理想的間隔

關於理想的間隔,一種說法是「睡一覺以後」,

但比較仔細的心理研究認為,最佳間隔要看「你想要保留記憶多久」。例如想要記憶 10 個月,那每 2 個月拿出來溫習,效果最持久。

也就是 20% 長度間隔。

在有長期間隔後,重複溫習同一份資料,我們說服大腦「這份資料很重要,將來會用到」,此時,記憶的機制,會把記憶投射到未來。

上述研究很容易落實在課堂中。理論上,「從頭到尾溫習」的效果比較好,所以期末考優於月考,但在實踐上,期末考比較容易引發「臨時抱佛腳」,而不是「每天間隔溫習」,這是理想與現實的落差。

重複同樣的東西

一直重複同樣的東西,會學得更多嗎?→ 會,只要不確定性存在,就會產生學習。除非已經 100% 精通。不停重複才會形成固化(consolidation),此時才會真正讓資訊進入潛意識,讓心智自動化。


上一篇
大腦如何精準學習 (2) 積極主動參與/好奇心
下一篇
大腦如何精準學習 (4) 固化
系列文
開卷計劃:做一個高手夢30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
TD
iT邦新手 4 級 ‧ 2021-10-31 17:44:29

學習和 association 無關,和驚訝有關

這太令人驚訝了!

我要留言

立即登入留言