分類在機器學習之中帶來了極大的貢獻,不論是學術論文或真實世界的應用,都是最普遍的
可以說是貢獻了point與coin呢
在課程中討論的是在西雅圖的作者想去吃一間好吃的壽司店,但是我西雅圖有非常多高評價的壽司店(都是四顆星)
此時他要考慮的就不單單只是好吃,還需要考慮到用餐環境、要排隊嗎....等
但是我這邊想用一個最近吃過的迷之涼麵店來對應作者的例子,他在網路上的評價非常兩極,所以剛好可以拿來用
從所有的google評論都來看,以下圖為例(已修改過)
假設我不關心涼麵,我去老陳涼麵是去喝味增湯的,所以我最關心的只有湯好不好喝
假設我們收集完這間小吃店的所有評論,我們把它輸入給這餐廳系統,藉由這個系統,他會告訴我
-小吃店服務品質好
-麵很難吃,可是我是來喝湯的,根本不重要
-排隊排超久,身為一個台灣人,一窩蜂吃排隊美食也只是日常,所以也不重要
-還有我最關心的湯,好喝
最後系統甚至會出現一個反饋涼麵過譽、湯好喝
該如何產生這樣的系統呢?,首先我們必須把所有評論拆開成一些語句,因為所有的評論都是由一些句子所構成
舉個例子,有一句話這麼說
我們將這句話輸入到情感分析器,這個分析器就會告訴我們這個句子是積極或消極的評價
有了這個分析器之後,我們就可以讀入所有的評論,並且選擇我所關心的內容相關的語句(與湯相關之評價)
把這些語句過篩選後的子集合,將他輸入到情感分析器當中,然後求出每個語句的平均值
不只如此我們還可以觀察出這些關於湯的語句,找出那一個是最積極與最消的評價
以這個例子來說
最積極應該是此湯只應天上有,人生難得幾回嘗
最消極則是因為其他都不好吃,所以才顯得湯的好喝