內容重點放在自然語言處理及時間序列資料處理上,分享背景知識,實作經典的演算法如word2vec、RNN、LSTM、GRU、seq2seq、Attention、BERT等技術,在網際網路上做資料探勘整理文本,建置雲端平台存放及管理資料庫,並應用在LineBot、智慧音箱、樹莓派及智慧機器人等裝置。
本篇為作者在IT邦幫忙的處女秀文章,還來不及編寫一篇自我介紹的文章就參賽了,真是有些害羞。 作者參賽目的是想整理自己在博士班所做那些零散的Side Projec...
讓電腦擁有理解人類語言的能力,就是自然語言處理 (Natural Language Processing,縮寫 NLP)[1]。然而,人和人之間就會誤會彼此的...
為了在文本之中把詞標記出來,必須要先讓電腦學會認識詞彙。 記住詞彙對電腦來說不是難事,要讓電腦知道詞與詞之間的關係就不簡單了,例如「研究生」跟「廉價勞工」這兩個...
計算機可以進行數值運算,因此我們需要將單詞或者詞組轉換成數字,才能進行存入計算機進行計算機。 那麼,要如何將文字轉化成數字呢? One-hot Encoding...
TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索(information retrieval...
今天分享兩部筆者很喜歡的短片[1,2],從語言學及認知科學的角度探討「語言」。 [1]從語言學的根本探討,解說語言學的基本及問題分類。[2]影片中前半段說道,使...