專注於
處理人類語言讓電腦能夠學會如何處理和分析,以達到電腦可以理解語言的目標。
本挑戰之路
期許能用以最淺顯易懂的方式介紹電腦的工具,讓挑戰們能夠使用這些工具指揮電腦處理海量的資訊。
最淺顯易懂的方式莫過於Python,本系列文章主要使用Anaconda搭建Python3.X版本為主要挑戰環境。
主要架構沿用Udemy
Natural Language Processing with Python課程架構
Day 02-05
了解與熟悉自然語言處理背景
Python基礎文本處理與檔案處理概念
自然語言進階處理概念與模組簡介
Day 06-13
NLP-python模組(Numpy, Pandas, Matplotlib)
NLP-python模組(SpaCy,NLTK,Scikit-learn)
文本分析-詞的向量 Word2Vec、Doc2Vec
Day 14-24
中文自然語言處理(jieba斷詞,停用詞,n-gram斷詞方法)
語意標註 Part-of-Speech(POS) Tagging
文本分類 Text Classification
語義與情感分析 Semantic and Sentiment Analysis
主題模型分析 Topic modeling
聊天機器人 ChatBots
Day 25-29
推薦系統主題介紹 Recommender System
推薦系統I - Content-based filtering
推薦系統II - Collaborative Filtering