前面講了DialoGPT和幾個Open-Domain對話的例子,那閒聊式對話能聊特定的異途或話題嗎?
舉個例子,最近各個社群媒體風向文越來越氾濫,那你是不是也曾懷疑過,這些風向文有可能不是出於人之手呢?
三年前(2021),ChatGPT還躺在OpenAI Lab之時,台大李宏毅老師、史丹佛大學(Stanford University)及Intel團隊就提出了一引導對話機器人(Guiding Chatbot),讓Chatbot能夠引導對話者的回應達到特定情緒。
比如說設定目標情緒為(Joyful),Guiding Chatbot就會想辦法透過聊天讓話語者愉悅
Guiding Chatbot為一個DialoGPT模型,為了能讓Chatbot了解情緒並引導話題,他們還特地訓練了一個情緒分類器(BERT-Based),藉由分類器的輸出來告訴Chatbot有沒有成功引導對話者的情緒。他們將分類器的誤差、特定字詞的出現頻率及對話者回覆長度組成一獎勵函式(Reward Function),再以策略梯度(Policy Gradient)進行強化學習。
研究最後還請19位受試者進行人工評估,結果還真的能誘導人類表達焦慮情緒,同時也還能保持話題的連貫性。
最佳模型達到0.27,數值越低表示受試者越焦慮
看到這個研究,不禁讓我聯想到《Re:從零開始的異世界生活》的憤怒大罪司教(シリウス・ロマネコンティ)的權能-洗魂(感情共享),能夠將目標的感情無差別擴散。
洗魂這一詞取得很好,隨著ChatGPT及其他LLM的演進,真的要好好預防被帶風向和洗腦這檔事。
明天,我們來討論什麼是自然語言理解(Natural Language Understanding,NLU)
來解釋語言模型是怎麼理解語言的。
Reference.
Put Chatbot into Its Interlocutor’s Shoes: New Framework to Learn Chatbot Responding with Intention