iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 17
0
AI & Data

今晚,我想來點經典NLP論文。系列 第 17

[D17] Emotion Intensities in Tweets (2017) 2/2

  • 分享至 

  • xImage
  •  

Key Points

  • 資料集分割
    • Train: Dev: Test = 50 :5 :45
    • https://ithelp.ithome.com.tw/upload/images/20201001/201285581xlCb1ovHl.png
  • 過往的研究發現
    • emoticon 對於表達情緒是冗余的,文字其實已經表達情緒了。
      • Go et al., 2009; Mohammad et al., 2013

      「今天真開心:)」

    • 也有研究發現 hashtag 也是冗余的。(Mohammad, 2012)

      This mindless support of a demagogue needs to stop. #racism #grrr #angry

    • 但強度呢?
      • 一般人不需要透過 hashtag 來理解作者的情緒,但用 hashtag 是不是能表達不同的強度呢?
      • 作者為了研究這點,才編纂了 HQT–NQT 組合。
  • HQT-NQT 強度分數比較
    • 下圖是用來比較在 HQT / NQT 中分數的差異。
      • 在對角線的右下方,代表在 HQT 中帶有該 hashtag 的強度比較強(i.e. x > y)。
      • 可以看到大部分的點(query term)都是在右下角。
        • 這很符合直覺,就像表情符號一樣,不帶不妨礙表達情緒,有帶強化情緒。
      • 但也有左上角的點,成因後述。
    • https://ithelp.ithome.com.tw/upload/images/20201001/20128558I4wq390Cgi.png
    • https://ithelp.ithome.com.tw/upload/images/20201001/20128558pexC1gX1lj.png
    • 根據上表第二欄,大部分的情況,多帶有 hashtag,會讓強度分數上升。
      • 這代表在強度方面,hashtag 並不是冗余資訊(不可忽略)。
    • 如果 query term 以外的文字充分表達了情緒,那 query term 的重要性就會下降
      • 這也很直覺 ...
    • 也觀察到有一些特殊的情況
      • 在下圖中,沒帶 hashtag 居然分數比較高。
        • 這是因為沒書寫的部分令讀者比較能
      • https://ithelp.ithome.com.tw/upload/images/20201001/20128558dYtUpeXMUc.png

上一篇
[D16] Emotion Intensities in Tweets (2017) 1/2
系列文
今晚,我想來點經典NLP論文。17
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言