在上一個章節,我們備妥了影片評論的資料,並且將0和1與負面及正面情緒做了前置的對照處理。上一篇的連結如下:
[DAY24] - 使用Azure Machine Learning Studio做自然語言情感分析(1):資料處理及分類篇
雖然我們這個系列主要在講Azure的多樣產品,但為了讓大家更了解實作的內容,接下來可能進入到比較學術的部分了!對於理論比較沒興趣的也可以直接跳到實做
的部分,體驗一下自然語言學習的魅力!(我順便也複習一下期末考XD)
這邊因為我們主軸是Azure Machine Learning Studio的應用,理論不會太冗長,只是幫助大家更了解我們實做的Scenario。
我們在處理自然語言的時候,通常會做以下的處理:
概論就講到這裡囉~~~~如果覺得不夠的讀者可以來上我們老師的Coursera公開課程喔!Zhai老師課程連結
接下來延續上一篇(資料處理),我們要進入自然語言處理的部分囉!!!!
我們可以看到裡面,有前面概論講到的:移除太常見的字以及字根字首處理。可以依照個人需求調整。
到目前為止做的是自然語言處理的部分,下一個章節我們會做機器學習的部分。串接邏輯式迴歸以及資料集訓練,Model評價等等。
做完整套你也曾經體驗用Microsoft Azure Machine Learning Studio打造自然語言分析Model囉!
下一篇我們將帶大家進行到最後一階段~~模型評價及佈署!!
使用Azure Machine Learning Studio做自然語言情感分析(3):機器學習模型(Logistic迴歸)、 模型評價及佈署