iT邦幫忙

2025 iThome 鐵人賽

DAY 3
1

引言

下圖是一則電影評論的留言,大家乍看之下,會覺得這是一則好評還是負評呢?
https://ithelp.ithome.com.tw/upload/images/20250915/20178719KTRNFFcLt0.png
圖片來源:Dcard

即便是我們看這則評論,在缺乏上下文的情況下,可能也會覺得有點難判斷>< 那電腦是否可以判斷一則評論是正面或負面呢?

這就是一個典型的 NLP 任務:情感分析 (Sentiment Analysis)。

但 NLP 的世界不只情感分析,還有非常多元的應用。今天就來了解一下 NLP 跟計算語言學的關係,也來盤點一下 NLP 的主要任務有哪些~

計算語言學(Comutational Linguistics)

計算語言學,顧名思義就是一個「計算機科學」和「語言學」結合的領域。在科技日新月異的發展下,人們開始想要讓電腦也可以理解語言,因此這門學科就誕生了。
計算語言學想解決的問題是,要怎麼讓傳統語言學所研究的語言的結構與法則,也可以讓電腦來做處理跟運算。那幾個語言學主要探討的子領域有:

  • 句法學(Syntax):研究句子的結構跟組成的規則。
  • 語音學(Phonetics):研究語音如何從人體產生,例如發音位置、聲音頻率。
  • 音韻學(Phonology):研究語音在語言系統裡的規律,例如音變、押韻。
  • 形態學(Morphology):研究詞(word)的內部結構,例如詞根、詞綴,以及詞形變化。
  • 語意學(Semantics):研究詞語和句子的意義,探討語言如何指涉世界。
  • 語用學(Pragmatics):研究語言在實際使用的現象,探討語境和意圖。

計算語言學的目標不只是「讓電腦讀懂語言」,更準確來說是希望能用電腦驗證語言學理論,最終能模擬語言的處理過程。因此計算語言學可說是在為 NLP 的應用打理論的基礎!

常見的 NLP 任務

「自然語言處理」其實是一個廣泛的詞,它還可以再分為兩個主要的子領域:自然語言理解(Natural Langauge Understanding, NLU)和自然語言生成 (Natural Language Generation, NLG)

圖片來源:https://botpress.com/tw/blog/natural-language-processing-nlp

因此 NLP 任務大致有三大類:

1. 基礎任務

讓電腦看懂語言的「基本單位」

  • 斷詞(Word Segmentation):將一句話分詞,例如:「我愛自然語言處理」→ [我][愛][自然語言][處理]
  • 詞性標註(Part-of-Speech Tagging):為詞語標記詞性,例如:「我愛自然語言處理」我/代名詞, 愛/動詞, 自然語言處理/名詞
  • 命名實體識別(Name Entity Recognition, NER):辨識專有名詞像是人名或地名,例如:台灣政治大學周杰倫

2. 理解任務

讓電腦了解「這句話在說什麼?」

  • 分類(Classification)
    • 情感分析:評論是正面還是負面?
    • 垃圾郵件分類:這封信是不是垃圾郵件?
  • 問答 (QA)
    • 使用者問「台北今天天氣如何?」,系統需要理解使用者想取得天氣資訊
  • 資訊抽取 (Information Extraction, IE)
    • 從文章中抽取關鍵資訊,例如一篇新聞中,「誰做了什麼?」

3. 生成任務

讓電腦自己「生出一段話」

  • 機器翻譯(Machine Translation):Google 翻譯的中翻英功能。
  • 文本摘要(Text Summarization):抓取文章的主要信息,把長篇文章濃縮成短文。
  • 對話生成(Dialogue Generation):像 ChatGPT 與 Siri 那樣的對話系統。
  • 文章續寫(Text Completion):輸入一段文字作為開頭,讓電腦把後續補完。

結語

計算語言學與自然語言處理,兩個領域並沒有明確的邊界,可以簡單理解為 CL 是理論基礎而 NLP 是實踐應用。兩者是相輔相成、手牽著手的好朋友~~

那麼目前 NLP 基礎概念介紹的主題到今天告一段落,明天開始會進入到下一個主題「語料處理」!!

References


上一篇
Day 2|文字探勘(Text Mining)的挑戰
下一篇
Day 4|文本清理(上):Regex 介紹
系列文
讓電腦聽懂人話:30 天 NLP 入門5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言