iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

人工智慧 X 自然語言處理 X 資料科學 系列

內容重點放在自然語言處理及時間序列資料處理上,分享背景知識,實作經典的演算法如word2vec、RNN、LSTM、GRU、seq2seq、Attention、BERT等技術,在網際網路上做資料探勘整理文本,建置雲端平台存放及管理資料庫,並應用在LineBot、智慧音箱、樹莓派及智慧機器人等裝置。

參賽天數 6 天 | 共 7 篇文章 | 4 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day-01-序幕

本篇為作者在IT邦幫忙的處女秀文章,還來不及編寫一篇自我介紹的文章就參賽了,真是有些害羞。 作者參賽目的是想整理自己在博士班所做那些零散的Side Projec...

DAY 2

Day-02-斷詞的問題

讓電腦擁有理解人類語言的能力,就是自然語言處理 (Natural Language Processing,縮寫 NLP)[1]。然而,人和人之間就會誤會彼此的...

DAY 3

Day-03-斷詞-詞向量

為了在文本之中把詞標記出來,必須要先讓電腦學會認識詞彙。 記住詞彙對電腦來說不是難事,要讓電腦知道詞與詞之間的關係就不簡單了,例如「研究生」跟「廉價勞工」這兩個...

DAY 4

Day-04-詞嵌入向量-原理

計算機可以進行數值運算,因此我們需要將單詞或者詞組轉換成數字,才能進行存入計算機進行計算機。 那麼,要如何將文字轉化成數字呢? One-hot Encoding...

DAY 5

Day-05-詞頻逆向檔案頻率

TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索(information retrieval...

DAY 6

Day-06-語言學淺談

今天分享兩部筆者很喜歡的短片[1,2],從語言學及認知科學的角度探討「語言」。 [1]從語言學的根本探討,解說語言學的基本及問題分類。[2]影片中前半段說道,使...

DAY 6

Day-07-斷詞

構成語句最基本為字詞,使用詞嵌入將字詞轉為詞向量後,為了從文本數據得到顯著而有用的資訊,需要的是探索支援自然語言處理的工具與嘗試,例如基於 python 的主題...