[Day 4]什麼是相對熵

第 12 屆 iThome 鐵人賽

DAY 5

AI & Data

12th鐵人賽

3139 瀏覽

接續上一篇提到的信息熵
我們如何用它來衡量兩個模型之間的差異

首先來個小測試
以下誰是王世堅...(我真心覺得兩個都是...)

在做上面的測試時
你是不是有這樣的過程

如果有如上述的過程經驗
則用熵衡量兩個模型之間的差異
其實就跟這個過程差不多

假設我們有 2 個模型函數及
放入相同的資料後得到兩個模型結果的分布及
若現在只能看的到模型結果的分布
想問若以為準，則與差多少呢？

首先我們先想著的臉，也就是
依次鎖定它的部位然後跟比較並加總結果
最後相當於是在比較兩個分配所提供的信息熵的差
也就是

最後可以化簡成

上述這個公式稱為「相對熵」(Relative Entropy)
或是「KL散度」(Kullback-Leibler divergence)
記為表示以為準，則與的差異

對了，
需要注意一下KL散度沒有對稱性，也就是說

畢竟以為準與以為準是不一樣的

目前已經可以評估兩個模型之間的差異
所以要挑選最好的模型函數
就要最小化
而這步驟竟然與以前很常聽到的 MLL 是等價的？

系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19830 篇

完賽人數

528 人

IT邦幫忙