iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

用R語言玩轉文字探勘 系列

用R語言玩轉文字探勘

鐵人鍊成 | 共 30 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 21

[Day 21] 利用R語言分類文本

文本分類 文本分類簡介 你知道電子郵件過濾器是怎麼把垃圾郵件挑出來的嗎?或者當你在社交媒體上發文,系統是如何自動標記你的貼文主題的?答案就是「文本分類」,而且通...

2023-10-06 ‧ 由 rlover 分享
DAY 22

[Day 22] 利用R語言做出主題模型 - LDA

主題模型 主題模型簡介 前面介紹不同類型的技術,例如從文本中找關鍵字、查看文本中詞彙之間的關係,還有判斷文字的情感,今天我們換個情境。 如果我們有一堆新聞文章,...

2023-10-07 ‧ 由 rlover 分享
DAY 23

[Day 23] 利用R語言做出主題模型 - STM

主題模型 主題模型比較 前一篇介紹如何用 LDA 的 R 程式碼,製作主題模型,這篇文章則要展示如何利用變化版的 STM。 想像一下,LDA 就像是一個喜歡「貼...

2023-10-08 ‧ 由 rlover 分享
DAY 24

[Day 24] 利用R語言做出主題模型 - intrusion test

主題模型 主題模型 - 評估 我們前面展示如何分別利用STM和LDA建構主題模型,要得到夠好的主題模型,我們有些事情可以做。先來介紹測試方法。具體可以參考這篇文...

2023-10-09 ‧ 由 rlover 分享
DAY 25

[Day 25] 利用R語言跑詞嵌入模型 - 原理與 skipgram

詞嵌入模型 詞嵌入模型簡介 想像一下,你有一堆文字,比如說一篇文章、一個推文或一個評論。你的目標是讓電腦理解這些文字中的意義或情感,但問題是,電腦不懂語言,它只...

2023-10-10 ‧ 由 rlover 分享
DAY 26

[Day 26] 利用R語言跑詞嵌入模型 - cbow 與測試

詞嵌入模型 詞嵌入模型 - CBOW CBOW(Continuous Bag-of-Words)是 word2vec 裡另一個演算法,CBOW 和 Skip-g...

2023-10-11 ‧ 由 rlover 分享
DAY 27

[Day 27] 用R語言玩轉文字探勘案例 - 架構與資料準備篇

文字探勘應用案例 應用案例 - 總統國慶致詞 我們來運用前面的技術來個應用案例,廢話不多說直接開始。 這次步驟有幾個:從維基文庫利用爬蟲爬下資料 -> 清...

2023-10-12 ‧ 由 rlover 分享
DAY 28

[Day 28] 用R語言玩轉文字探勘案例 - 清資料與斷詞篇

文字探勘應用案例 應用案例 - 清資料與斷詞 我們來看要如何處理爬下的資料吧! 這次我們會應用最近正在風口浪尖的中研院ckip小組開發出的斷詞系統,所以開始時要...

2023-10-13 ‧ 由 rlover 分享
DAY 29

[Day 29] 用R語言玩轉文字探勘案例 - 分析篇

文字探勘應用案例 應用案例 - 分析篇 在分析前,我們要討論的是「具體要分析什麼」,這是每次分析資料以前,要先問的問題。當然你也可以先做個EDA觀察資料,但在一...

2023-10-14 ‧ 由 rlover 分享
DAY 30

[Day 30] 用R語言玩轉文字探勘案例 - 視覺化篇

應用案例 - 視覺化篇 我們得到資料後,最後一步就是視覺化了!因為重點是程式碼,所以沒有每張圖片都上傳,可以一張張研究! library(gt) df_yea...

2023-10-15 ‧ 由 rlover 分享