Day10: DST-讓Chatbot紀錄對話中重要的資訊

2024 iThome 鐵人賽

DAY 10

AI/ ML & Data

軟體工程師的脫魯日誌-持續介紹hardcore AI研究直到脫魯🥹系列第 10 篇

16th鐵人賽 dst tod task-oriented dialogue bert

渴望脫魯的SWE

2024-09-24 00:44:58

334 瀏覽

分享至

我們從前面兩天瞭解了Chatbot 以NLU任務解析話語中的含義，
以及將有意義的資訊擷取出來。

但是如果你今天到一間旅館，要求住宿，
總不可能只率性的說一句「今晚我要住下來」吧？

訂房除了需告知意圖外，
還需要提供入住日期、入住天數、入住人數等資訊才能完成訂房。

既然要提供那麼多資訊，就很難在一句話內就講完
那交互對話的結果，就會造成對話落落長，要讓Chatbot一次總結也難

那Chatbot要如何在對話過程中記錄你提到的資訊並總結呢？
這時候，我們就要用到對話狀態追蹤了！！！

對話狀態追蹤-紀錄對話中有用的資訊

對話狀態追蹤（DST，Dialogue State Tracking），就是將對話中有用的資訊視為槽(Slot)及槽值(Value)，並將其紀錄為狀態(State)，直到對話結束前，都會不斷的將槽及槽值更新至狀態中。

你可以理解成DST目標是把使用者說的話簡化為一個有用的資訊庫，也可以理解為做了對話摘要。

DST的做法為以下:

使用者意圖識別(Intention Classification)：分析使用者輸入，識別其意圖，如預訂餐廳、查詢航班等。
槽位填充(slot-Filling)：提取與意圖相關的具體資訊（如日期、時間、地點等），並將其儲存在相應的插槽中。
對話管理：維護對話的上下文，以便系統能夠在多輪對話中保持一致性。

交互對話的過程中，DST將每輪對話提供的資訊記錄下來，並整理成類似Python字典的資料結構。

使用情境-以CrossWOZ語料為例

若我詢問: 「我想找有健身房，价格为600且评分为4以上的酒店」
DST會將价格及评分視為槽(Slot)，並將
那DST就會將對話總結成以下狀態格式：

{
    "名称": "",
    "酒店类型": "",
    "地址": "",
    "地铁": "",
    "电话": "",
    "酒店设施": "健身房",
    "价格": "600",
    "评分": "4",
    "周边景点": "",
    "周边餐馆": "",
    "周边酒店": ""
}

若Chatbot詢問: 「请问你想要的酒店附近有哪些景点呢?」
你則回: 「法源寺和民族文化宫附近」
對話狀態又會紀錄成以下:

{
    "名称": "",
    "酒店类型": "",
    "地址": "",
    "地铁": "",
    "电话": "",
    "酒店设施": "健身房",
    "价格": "600",
    "评分": "4",
    "周边景点": [
        "法源寺",        # 對話狀態會隨著對話做累加
        "民族文化宫"
    ],
    "周边餐馆": "",
    "周边酒店": ""
}