前面的四天依序介紹了NLU、DST、DPL及NLG,你們可能會想:
"蛤~? 鋪梗鋪這麼久是要講什麼? 這跟Chit-chat Chatbot有什麼關聯?"
那是因為我們希望Chatbot不僅要跟我們聊天,還要會幫我們解決問題!
所以~~ 接下來要介紹集四個模型為一體的 Task-Oriented Pipeline System!
在Day2時,
我們提到對話系統分為閒聊式(Chit-chat)和任務導向式(Task-oriented),
相較於閒聊式對話系統,TOD更專注於解決用戶需求。
在TOD中,我們通常分為使用者(user)及系統(system),系統就是我們常說的Chatbot。
Task-Oriented Dialogue(TOD) System有四個架構:
四個模型都是獨立訓練的,你可能會覺得為什麼不像Chit-chat Dialogue一樣,硬Train一個End-to-End的模型就好?
有以下幾個原因:
所以訓練一個End-to-End架構... 貴R... (除非你像OpenAI、Google或Microsoft一樣Rich)
在TOD系統中,除了對話、對話行為或狀態,還可能包含:
(粗斜體為TOD系統和語料必須包含之項目)
而目前的開源TOD資料集如下:
Dataset | Dialogs | Goal | DA-U | DA-S | State | API result | DataBase |
---|---|---|---|---|---|---|---|
Camrest | 676 | ✅ | ✅ | ✅ | ✅ | ✅ | |
WOZ 2.0 | 1200 | ✅ | ✅ | ||||
KVRET | 3030 | ✅ | ✅ | ✅ | |||
DailyDialog | 13118 | ✅ | |||||
Taskmaster-1 | 13175 | ✅ | ✅ | ✅ | |||
Taskmaster-2 | 17303 | ✅ | ✅ | ✅ | |||
MultiWOZ 2.1 | 10438 | ✅ | ✅ | ✅ | ✅ | ✅ | |
Schema-Guided | 22825 | ✅ | ✅ | ✅ | ✅ | ||
MetaLWOZ | 40203 | ✅ | |||||
CrossWOZ (zh) | 6012 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Taskmaster-3 | 23757 | ✅ | ✅ | ✅ | ✅ |
接下來,我們將詳細介紹北京清大以Pytorch撰寫的任務導向對話工具包-ConvLab
Reference.
GitHub-ConvLab-3