iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 3
1

為了在文本之中把詞標記出來,必須要先讓電腦學會認識詞彙。

記住詞彙對電腦來說不是難事,要讓電腦知道詞與詞之間的關係就不簡單了,例如「研究生」跟「廉價勞工」這兩個之間的關係。

我們在Github上面抓一個專案來練習一下[1],語料庫取自維基百科2019/08/20的備份,安裝Gensim、Jieba之後就可以用Word2Vec來自己訓練詞嵌入了。

https://ithelp.ithome.com.tw/upload/images/20190904/20120177Y7afPnXi4z.png

Reference

  1. 使用 gensim 訓練中文詞向量

--待補完--

「當一個人一心一意做好事情的時候,他最終是必然會成功的。」-盧梭


上一篇
Day-02-斷詞的問題
下一篇
Day-04-詞嵌入向量-原理
系列文
人工智慧 X 自然語言處理 X 資料科學7
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言