技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
19
0
AI & Data
嘗試在AI世界闖蕩
系列 第
19
篇
Day 19 AI核心應用:自然語言處理(NLP)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-04 08:33:26
190 瀏覽
分享至
自然語言處理重要性
瞭解知識重要性
知識主要除除在文字中
互動溝通的重要性
資訊爆炸時代的必須性
⇨執行正確決策行動
自然語言處理挑戰
自然語言處理階層分析架構
語法分析Syntacctic Analysis:利用語文的法則去瞭解一個句子內,詞與詞之間應該有的正確順序組合,與其依定程度遵守的文法。
語意分析Semantic Analysis:瞭解一個句子內詞與詞彼此的關係,與句子要表達的意涵與意圖。
由上而下階層架構
①斷詞Token:要分析的文本共有幾個詞。
②停用詞Stop Words:那些詞是重要、那些詞是可以忽略的。
③詞性標註POS:句子內的詞,其屬性是形容詞、動詞、名詞的哪一個。
④詞向量Word Vectors:分析每個詞自身特徵為什麼。
⑤句法剖析Parsing:瞭解這個句子的結構、詞與詞之間彼此關係、何者是主詞或受詞。
⑥命名實體識別Named Entity Retrieval(NER):句子內有哪些專有名詞。
⑦分析句子主要意涵與意圖Semantic:文本分類、摘要抽取、意圖分析。
自然語言處理開發架構
基於法則NLP(Rule-Based NLP)
1980年代專家系統時期主要方法
靠if 、then、else法則來處理
硬式法則,必須完全一致才可以啟動法則
只能用在領域範圍小、句法簡單、關鍵字少而明確小型QA系統
基於機器學習方法NLP(ML Based NLP)
雖比法則學派更有效且精確,但在複雜、非結構語音辨識、語音生成、機器翻譯方面無法突破人類心理閥值。
➊利用直觀實用知識去帶法則
➋由下而上Bottom Up取代由上而下Top Down
➌由模仿取代理解
➍特徵工程取代法則:透過特徵抽取後,可利用SVM樸素貝式推理、KNN、Decision Tree等演算法來抽取關鍵詞。
➎不同任務不同Model:不同特徵工程、不同選用演算法。
➏預處理重視:注重文字預處理,內涵詞語句階段的所有語法分析工具與語意分析工具(斷詞、句法剖析Parsing)
架構圖:
基於深度學習NLP(DL Based NLP)
2015年後,衝破在複雜、非結構語音辨識、語音生成、機器翻譯方面障礙。
➊特徵工程方面:少了人為特徵工程階段。
➋資料預處理方面:需求度不高,自己學會並執行類似斷詞、停用詞、詞性標註及句法剖析工作。
➌詞向量方面:利用詞向量取代傳統的法則與機器學習所重視計算詞出現頻率的特徵功能,所以需要非常大量運算力與訓練成本。
架構圖:
混合型NLP(Mixed NLP Framework)
上述三個結合。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 18 AI核心應用:自然語言處理
下一篇
Day 20 AI核心應用:自然語言處理(NLP)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22201
篇
完賽人數
602
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
熟識南投軟體工程師推薦
如何練國考資訊題?
筆電無法使用usb開機重裝系統
CCNA相關問題詢問
電商在販售商品時,可以自行縮短保固期限嗎?
求救 有人會修改cookie權限嗎
python scrapy pipeline實作問題請教
防火牆互通問題
函數問題
桌面的使用者文件圖標壞掉
熱門回答
防火牆互通問題
筆電無法使用usb開機重裝系統
if函數中的>&<&=是否可以使用儲存格代替
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
熟識南投軟體工程師推薦
熱門文章
每日一篇學習筆記 直到我做完專題 :( [Day1]
每日一篇學習筆記 直到我做完專題 :( [Day2]
[翻譯]使用AI工具寫程式碼時如何避免「AI幻覺」?
每日一篇學習筆記 直到我做完專題 :( [Day3]
每日一篇學習筆記 直到我做完專題 :( [Day4]
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}