哈囉大家,昨天簡單介紹了自然語言處理(NLP)及它的優缺點。今天延續昨天的內容來談NLP的組成部分,總共十一個。
1.話語:使用者說出或鍵入的確切短語。(話語為NLP系統將分析以確定意圖並提取相關實體的輸入)
2.實體:提供了與intent相關的具體細節。實體為聊天機器人提供正確安排會議所需的資訊。
3.意圖:用戶的目標。
4.分詞化:將句子分解成更小的部分,稱為標記,這些部分可以是單詞、標點符號。
5.詞幹提取和詞行還原:詞幹提取將一個詞切入其基礎—ex:scheduling標記schedule
6.詞性標記:標註每個詞的詞性(如名詞、動詞等)。
7.命名實體識別:識別文本中的實體(如人名、地名、組織名等)。
8.情感分析:情緒分析評估輸入的語氣(如正面、負面給予安撫或道歉等回應)。
9.情境理解:使用上下文理解來根據周圍的文本來解釋單詞和短語的含義。
10.機器學習:通過使用機器學習(machine learning)模型來提高其理解和生成語言的能力。
11.對話管理員:管理跟蹤對話的上下文,確保根據之前的輸入做出連貫的回應。