iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 10
0

今天是Natural Language的第一篇,這是一個可以用來分析語意並萃取出你要的資訊的工具。跟前面的服務一樣,也分成AutoML Natural Language跟Natural Language API。

  • AutoML Natural Language:提供一個UI介面訓練自己的Model,並用自己的Model做語意分析、詞彙分類之類的工作。
  • Natural Language API:用預先訓練好的API直接給你基本的分析,讓我們更快理解Natural Language的語意、詞彙、內容分析之類的功能。

好,我們也是先來玩看看它個Demo
https://ithelp.ithome.com.tw/upload/images/20190917/20103835HQX39RGwMc.jpg

範例裡已經預先載好一段文字,我們就直接跑分析看看。這邊很快地分析出了一些資訊:

  • Entities
    https://ithelp.ithome.com.tw/upload/images/20190917/20103835L2L2sXeDMy.jpg
    一段文字丟進去以後,快速的找到了ORGANIZATIONLOCATIONADDRESSPERSONPRICE等等的資訊。

值得注意的是有個Salience:Salience shows importance or centrality of an entity to the entire document text, ranges from 0 (less salient) to 1 (highly salient).)
意思是對整段文字的重要性。

  • Sentiment
    https://ithelp.ithome.com.tw/upload/images/20190917/20103835XijN9jMafh.jpg

Score = [-1.0, 1.0], Magnitude = [0, inf)
分成段落及Entities的情緒分析,整個文章可以看出第一段比較沒什麼情緒,但第二段被判斷有正向情緒。
下半段則顯示有哪些Entities有情緒及強度,可以看出usersphones這兩個字有較高的情緒與強度。

  • Syntax
    https://ithelp.ithome.com.tw/upload/images/20190917/20103835pPUGjTRrou.jpg
    這邊分析整個文章的結構,分兩段,所以有兩張結構圖。並分析出Dependency依賴關係Parse LabelPart of speech詞性Lemma(感覺是從哪變化而來)Morphology型態。是一個對字詞結構分析很有幫助的工具

  • Categories
    https://ithelp.ithome.com.tw/upload/images/20190917/20103835uYTKS4BbN2.jpg
    這邊是分析這是屬於哪個類型的文章,判斷以後AI給他分類為/Internet & Telecom/Mobile & Wireless也是滿準確的。

這邊有更多的分類:https://cloud.google.com/natural-language/docs/categories

這篇文章差不多結束,最後來玩一下中文分析,我從故宮官網簡介第一段擷取下來,貼進去語意分析看看結果。
https://ithelp.ithome.com.tw/upload/images/20190917/20103835p7T6qfwW2c.jpg
SentimentCategories的部分還不是很支援,但EntitiesSyntax倒是都可以看到結果。

OK,今天工作提早結束,謝謝大家。


上一篇
[Day 9] Google Video Intelligence AI - 子系列最終章
下一篇
[Day 11] Google Natural Language - 2
系列文
Overview of Machine Learning Products30

尚未有邦友留言

立即登入留言