下圖是一則電影評論的留言,大家乍看之下,會覺得這是一則好評還是負評呢?
圖片來源:Dcard
即便是我們看這則評論,在缺乏上下文的情況下,可能也會覺得有點難判斷>< 那電腦是否可以判斷一則評論是正面或負面呢?
這就是一個典型的 NLP 任務:情感分析 (Sentiment Analysis)。
但 NLP 的世界不只情感分析,還有非常多元的應用。今天就來了解一下 NLP 跟計算語言學的關係,也來盤點一下 NLP 的主要任務有哪些~
計算語言學,顧名思義就是一個「計算機科學」和「語言學」結合的領域。在科技日新月異的發展下,人們開始想要讓電腦也可以理解語言,因此這門學科就誕生了。
計算語言學想解決的問題是,要怎麼讓傳統語言學所研究的語言的結構與法則,也可以讓電腦來做處理跟運算。那幾個語言學主要探討的子領域有:
計算語言學的目標不只是「讓電腦讀懂語言」,更準確來說是希望能用電腦驗證語言學理論,最終能模擬語言的處理過程。因此計算語言學可說是在為 NLP 的應用打理論的基礎!
「自然語言處理」其實是一個廣泛的詞,它還可以再分為兩個主要的子領域:自然語言理解(Natural Langauge Understanding, NLU)和自然語言生成 (Natural Language Generation, NLG)
圖片來源:https://botpress.com/tw/blog/natural-language-processing-nlp
因此 NLP 任務大致有三大類:
讓電腦看懂語言的「基本單位」
「我愛自然語言處理」→ [我][愛][自然語言][處理]
「我愛自然語言處理」
→ 我/代名詞
, 愛/動詞
, 自然語言處理/名詞
台灣
、政治大學
、周杰倫
讓電腦了解「這句話在說什麼?」
讓電腦自己「生出一段話」
計算語言學與自然語言處理,兩個領域並沒有明確的邊界,可以簡單理解為 CL 是理論基礎而 NLP 是實踐應用。兩者是相輔相成、手牽著手的好朋友~~
那麼目前 NLP 基礎概念介紹的主題到今天告一段落,明天開始會進入到下一個主題「語料處理」!!