iT邦幫忙

文字探勘相關文章
共有 35 則文章
鐵人賽 AI & Data DAY 16
用R語言玩轉文字探勘 系列 第 16

技術 [Day 16] 利用R語言計算詞頻

詞頻 詞頻簡介與案例 詞頻,也就是詞彙出現頻率,是一個非常直觀且易懂的指標。 我們先來看中央社的蔡總統關心什麼文字會說話分析。在這篇文章中,我們擷取幾個句子:「...

鐵人賽 AI & Data DAY 29
用R語言玩轉文字探勘 系列 第 29

技術 [Day 29] 用R語言玩轉文字探勘案例 - 分析篇

文字探勘應用案例 應用案例 - 分析篇 在分析前,我們要討論的是「具體要分析什麼」,這是每次分析資料以前,要先問的問題。當然你也可以先做個EDA觀察資料,但在一...

鐵人賽 AI & Data DAY 26
用R語言玩轉文字探勘 系列 第 26

技術 [Day 26] 利用R語言跑詞嵌入模型 - cbow 與測試

詞嵌入模型 詞嵌入模型 - CBOW CBOW(Continuous Bag-of-Words)是 word2vec 裡另一個演算法,CBOW 和 Skip-g...

鐵人賽 AI & Data DAY 24
用R語言玩轉文字探勘 系列 第 24

技術 [Day 24] 利用R語言做出主題模型 - intrusion test

主題模型 主題模型 - 評估 我們前面展示如何分別利用STM和LDA建構主題模型,要得到夠好的主題模型,我們有些事情可以做。先來介紹測試方法。具體可以參考這篇文...

鐵人賽 AI & Data DAY 19
用R語言玩轉文字探勘 系列 第 19

技術 [Day 19] 利用R語言找詞彙關係 - correlation

詞彙關係 - correlation 上面的 bigram 很好懂,它的特點就是簡單且直觀,只要考慮相鄰的詞的關係,而且還能夠保留有順序性的資訊,計算效率也高,...