iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 5
0

Classifictaion

分類在機器學習之中帶來了極大的貢獻,不論是學術論文或真實世界的應用,都是最普遍的

可以說是貢獻了point與coin呢

Analyzing the sentiment of reviews: A case study in classification

在課程中討論的是在西雅圖的作者想去吃一間好吃的壽司店,但是我西雅圖有非常多高評價的壽司店(都是四顆星)

此時他要考慮的就不單單只是好吃,還需要考慮到用餐環境、要排隊嗎....等

但是我這邊想用一個最近吃過的迷之涼麵店來對應作者的例子,他在網路上的評價非常兩極,所以剛好可以拿來用

前陣子在PTT上還有著這麼一篇文章

從所有的google評論都來看,以下圖為例(已修改過)

https://ithelp.ithome.com.tw/upload/images/20171223/20107448J5cDSThYx2.png

  • 店員親切又帥氣從這評論來看,是正面評價
  • 接著下一個評論卻說,醬汁無法與麵條吸附不及格,這意味著涼麵不好吃
  • 然後下一個評論員又說需要耐心等候,可想而知要排隊排很久
  • 但最後一個評論卻說味增湯很好喝,因此他的湯品確實是獲得非常高的評價

假設我不關心涼麵,我去老陳涼麵是去喝味增湯的,所以我最關心的只有湯好不好喝

假設我們收集完這間小吃店的所有評論,我們把它輸入給這餐廳系統,藉由這個系統,他會告訴我

-小吃店服務品質好
-麵很難吃,可是我是來喝湯的,根本不重要
-排隊排超久,身為一個台灣人,一窩蜂吃排隊美食也只是日常,所以也不重要
-還有我最關心的湯,好喝

最後系統甚至會出現一個反饋涼麵過譽、湯好喝
https://ithelp.ithome.com.tw/upload/images/20171223/20107448U7yawaUban.png

該如何產生這樣的系統呢?,首先我們必須把所有評論拆開成一些語句,因為所有的評論都是由一些句子所構成

舉個例子,有一句話這麼說
https://ithelp.ithome.com.tw/upload/images/20171223/20107448qTJBaL0M69.png

我們將這句話輸入到情感分析器,這個分析器就會告訴我們這個句子是積極或消極的評價

有了這個分析器之後,我們就可以讀入所有的評論,並且選擇我所關心的內容相關的語句(與湯相關之評價)

把這些語句過篩選後的子集合,將他輸入到情感分析器當中,然後求出每個語句的平均值

不只如此我們還可以觀察出這些關於湯的語句,找出那一個是最積極與最消的評價

以這個例子來說

最積極應該是此湯只應天上有,人生難得幾回嘗

最消極則是因為其他都不好吃,所以才顯得湯的好喝

https://ithelp.ithome.com.tw/upload/images/20171223/20107448nNN05K8kiy.png

Reference:


上一篇
[day 3] 回歸分析-3
下一篇
[day 5] 分類-2
系列文
到底是在learning什麼拉30

尚未有邦友留言

立即登入留言