技術問答
技術文章
iT 徵才
聊天室
2026 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
19
0
AI & Data
嘗試在AI世界闖蕩
系列 第
19
篇
Day 19 AI核心應用:自然語言處理(NLP)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-04 08:33:26
512 瀏覽
分享至
自然語言處理重要性
瞭解知識重要性
知識主要除除在文字中
互動溝通的重要性
資訊爆炸時代的必須性
⇨執行正確決策行動
自然語言處理挑戰
自然語言處理階層分析架構
語法分析Syntacctic Analysis:利用語文的法則去瞭解一個句子內,詞與詞之間應該有的正確順序組合,與其依定程度遵守的文法。
語意分析Semantic Analysis:瞭解一個句子內詞與詞彼此的關係,與句子要表達的意涵與意圖。
由上而下階層架構
①斷詞Token:要分析的文本共有幾個詞。
②停用詞Stop Words:那些詞是重要、那些詞是可以忽略的。
③詞性標註POS:句子內的詞,其屬性是形容詞、動詞、名詞的哪一個。
④詞向量Word Vectors:分析每個詞自身特徵為什麼。
⑤句法剖析Parsing:瞭解這個句子的結構、詞與詞之間彼此關係、何者是主詞或受詞。
⑥命名實體識別Named Entity Retrieval(NER):句子內有哪些專有名詞。
⑦分析句子主要意涵與意圖Semantic:文本分類、摘要抽取、意圖分析。
自然語言處理開發架構
基於法則NLP(Rule-Based NLP)
1980年代專家系統時期主要方法
靠if 、then、else法則來處理
硬式法則,必須完全一致才可以啟動法則
只能用在領域範圍小、句法簡單、關鍵字少而明確小型QA系統
基於機器學習方法NLP(ML Based NLP)
雖比法則學派更有效且精確,但在複雜、非結構語音辨識、語音生成、機器翻譯方面無法突破人類心理閥值。
➊利用直觀實用知識去帶法則
➋由下而上Bottom Up取代由上而下Top Down
➌由模仿取代理解
➍特徵工程取代法則:透過特徵抽取後,可利用SVM樸素貝式推理、KNN、Decision Tree等演算法來抽取關鍵詞。
➎不同任務不同Model:不同特徵工程、不同選用演算法。
➏預處理重視:注重文字預處理,內涵詞語句階段的所有語法分析工具與語意分析工具(斷詞、句法剖析Parsing)
架構圖:
基於深度學習NLP(DL Based NLP)
2015年後,衝破在複雜、非結構語音辨識、語音生成、機器翻譯方面障礙。
➊特徵工程方面:少了人為特徵工程階段。
➋資料預處理方面:需求度不高,自己學會並執行類似斷詞、停用詞、詞性標註及句法剖析工作。
➌詞向量方面:利用詞向量取代傳統的法則與機器學習所重視計算詞出現頻率的特徵功能,所以需要非常大量運算力與訓練成本。
架構圖:
混合型NLP(Mixed NLP Framework)
上述三個結合。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 18 AI核心應用:自然語言處理
下一篇
Day 20 AI核心應用:自然語言處理(NLP)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19833
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
現在Mail Server上雲365 Outlook不能向下相容?
(已解決)目前使用AWS的Lightsail服務,但沒使用RDS,一直被RDS服務扣錢
使用按鍵精靈完成ERP系統的單據輸入作業
Exchange online journal到外部....
SUPERSET 問題請教
WF ERP GP 小版本更新
LINKEDIN相關事宜(徵人,被徵)
熱門回答
現在Mail Server上雲365 Outlook不能向下相容?
使用按鍵精靈完成ERP系統的單據輸入作業
WF ERP GP 小版本更新
Exchange online journal到外部....
熱門文章
2026 年前端工程師的生存戰:當程式碼不再是瓶頸,什麼才是你的核心價值?
[POG-Task-05] 對待任務與提示詞如同程式碼一樣
我寫了一個 CLI 工具,因為教 PM 什麼是 /etc/hosts 比自己做還累
[POG-Task-06] 什麼是「AI 原生任務治理模型」?
你用的 AI 工具可能正在執行攻擊者的指令——3 個 MCP 漏洞拆解與防禦設計
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}