iT邦幫忙

r語言相關文章
共有 115 則文章

技術 在 Ubuntu 安裝 RStudio 後,啟用時一直 crash 的解法

在 Ubuntu 18.04 裝完 RStudio 之後,打開來就一直當機,查了一下 log ,錯誤訊息有下以內容 nouveau: kernel rejec...

鐵人賽 影片教學 DAY 17

技術 [Day-17] R語言 - 分群應用(一) GMM數值補值-下 ( Fill.NA with GMM in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 (延續昨天) #均值 vs 列入各群權重 final_mean <- final[,c(1:4,10...

鐵人賽 影片教學 DAY 15

技術 [Day-15] R語言 - 分群應用(一) 補值前處理 ( Fill.NA with Clustering in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## 應用一: 分群補數值 #### library(missForest) #產生隨機na值 libra...

技術 Rstudio

Shift+Ctrl+R 分段 可縮Shift+Ctrl+C 多行註解Shift+Ctrl+M %>% Alt + 減號 <-

技術 有關斐波那契通道繪製 R語言

能請問r語言相關問題,虛擬貨幣常用技術分析:斐波那契通道對於r是有辦法繪製的嗎?需要用何種套件才有辦法呢?還請各位幫幫忙

鐵人賽 AI & Data DAY 4

技術 [Day 4] R語言資料匯入/匯出與存檔

安裝好package後,可以嘗試在R Script中呼叫該package,來確認是否安裝成功,程式碼如下: library(xlsx) 在講解檔案的匯入之前,...

鐵人賽 影片教學 DAY 16

技術 [Day-16] R語言 - 分群應用(一) GMM數值補值-上 ( Fill.NA with GMM in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 (延續昨天) #演算法 library(ClusterR) opt_gmm = Optimal_Clust...

鐵人賽 影片教學 DAY 23

技術 [Day-23] R語言 - 分群應用(四) 建構新特徵 ( generate feature by clustering in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## 應用四: 建構特徵 #### # 用GMM,產出數值+類別型特徵 library(naniar)...

鐵人賽 AI & Data DAY 2

技術 [Day 2] RStudio 操作介面介紹

安裝好RStudio後,接著我們就來介紹一些相關的設定吧! 以下將會分成幾個部分來介紹: 版面配置 RStudio介面總共可以分為4個區塊 第一塊Wor...

鐵人賽 AI & Data DAY 9

技術 [Day 9] R語言apply函數

apply函數是一系列的,有些情況下可以用來取代for迴圈,做循環的動作,由於apply家族較為龐大,本篇只會介紹在資料分析中常用的幾種。 apply():...

鐵人賽 AI & Data DAY 2
用R語言玩轉文字探勘 系列 第 2

技術 [Day 2] 使用R語言的文字探勘框架 - tidytext

背景 開發者們打造許多套件,替人們處理文字探勘。有些針對特定任務,例如在主題模型章節中我會介紹stm、LDA,在詞向量章節中則以gensim、word2vec為...

鐵人賽 AI & Data DAY 1

技術 [Day 1] R以及R Studio安裝

如果你正在看這篇文章,相信是對R語言及資料分析感興趣的朋友,不妨跟著我的腳步,一起學習30天吧!使用R語言做資料分析已有一段時間,因此興起了系統性整理那些冷門...

鐵人賽 AI & Data DAY 10
用R語言玩轉文字探勘 系列 第 10

技術 [Day 10] 以R語言分詞 - 使用 quanteda 與 jiebaR

利用R語言分詞 分詞流程 - 利用 quanteda library(quanteda) # Chinese stopwords ch_stop <- q...

鐵人賽 AI & Data DAY 1
用R語言玩轉文字探勘 系列 第 1

技術 [Day 1] 前言 - 用R語言如何玩轉文字探勘

文字探勘簡介 這個系列的文章以文字探勘為主題,會介紹文字探勘的原理、在文字探勘過程中要注意的事情,並以R語言為背景,帶大家實作,而且會有很貼近生活的案例。 文字...

鐵人賽 AI & Data DAY 4
用R語言玩轉文字探勘 系列 第 4

技術 [Day 4] R語言與正規表達式: 基本概念

正規表達式 在利用文字探勘技術,完成讓人看完眼睛為之一亮的分析之前,我們要先確保資料集的品質足夠優異,否則只會應驗時常聽到的名言:「garbage in, ga...

鐵人賽 AI & Data DAY 23
用R語言玩轉文字探勘 系列 第 23

技術 [Day 23] 利用R語言做出主題模型 - STM

主題模型 主題模型比較 前一篇介紹如何用 LDA 的 R 程式碼,製作主題模型,這篇文章則要展示如何利用變化版的 STM。 想像一下,LDA 就像是一個喜歡「貼...

鐵人賽 AI & Data DAY 27
用R語言玩轉文字探勘 系列 第 27

技術 [Day 27] 用R語言玩轉文字探勘案例 - 架構與資料準備篇

文字探勘應用案例 應用案例 - 總統國慶致詞 我們來運用前面的技術來個應用案例,廢話不多說直接開始。 這次步驟有幾個:從維基文庫利用爬蟲爬下資料 -> 清...

鐵人賽 AI & Data DAY 9
用R語言玩轉文字探勘 系列 第 9

技術 [Day 9] 以R語言分詞 - 預處理 & 使用 tidytext

利用R語言分詞 利用R語言分詞 - 預處理 上面有提到,在斷詞前其實有些任務要先進行,我們結合dplyr和stringr,再搭配其他套件展示具體怎麼做吧! #...

鐵人賽 AI & Data DAY 14

技術 [Day 14] 資料分析-數據的種類

今天不講R語言,要來講講在資料分析中,我們常看到的數據種類,認識數據的種類有助於在進行資料處理時的判斷。 數據的種類可以分成兩大類:定性、定量,而這兩大類又...

鐵人賽 AI & Data DAY 6
用R語言玩轉文字探勘 系列 第 6

技術 [Day 6] R語言與字串處理: 利用stringr

字串處理情境介紹 文字探勘的諸多應用如情緒分析、文本分類,聽起來都很美好,但在分析資料以前,首先要有乾淨資料。舉例來說,若我們想分析歷屆台灣總統的演講稿,在事前...

鐵人賽 AI & Data DAY 11

技術 [Day 11] R語言dplyr套件介紹(1)

如果你正在學習使用R語言做資料分析,那你千萬不能錯過dplyr這個套件。dplyr主要使用於dataframe上,可以進行各式各樣的資料前處理,我們就開始介紹...

鐵人賽 AI & Data DAY 10

技術 [Day 10] R語言melt()與dcast()函數使用

不知不覺鐵人賽已經進行1/3了,R語言的基本介紹也已經差不多結束,接著會進入分析中常用的資料處理環節,今天我們就先來介紹數據的欄位格式轉換 這邊會繼續使用D...

鐵人賽 AI & Data DAY 7
用R語言玩轉文字探勘 系列 第 7

技術 [Day 7] R語言中的字串資料、路徑與編碼

R語言中的字串資料 前面章節「總統演說」的範例中,能看到R語言中常見的文字資料格式,要不是儲存在dataframe中,每筆資料都是文章、段落、句子,或者是用li...

鐵人賽 AI & Data DAY 25

技術 [Day25] R語言-決策樹(分類模型)

在分類模型中除了邏輯斯迴歸以外,另一個常見的模型為樹模型(tree-based model),常見的有決策樹、迴歸樹,樹模型的優點是模型好解釋、模型訓練速度快,...

鐵人賽 AI & Data DAY 11
用R語言玩轉文字探勘 系列 第 11

技術 [Day 11] 以R語言分詞 - 在R語言中使用ckip

利用R語言分詞 在R語言中使用ckip 接下來,我們特別花一個小節介紹如何在R語言中使用由中研院開發的一系列斷詞工具「CKIP」。根據中研院介紹,這個工具可以斷...

鐵人賽 AI & Data DAY 20
用R語言玩轉文字探勘 系列 第 20

技術 [Day 20] 利用R語言分析情感

情緒分析 情緒分析介紹 情緒/情感分析(sentiment analysis),簡單來說就是辨別話語中的情感。 最一開始的方式就像把文字拆解成積木,這塊積木是正...

鐵人賽 AI & Data DAY 5
用R語言玩轉文字探勘 系列 第 5

技術 [Day 5] R語言與正規表達式: 進階語法和實例

進階正規表達式語法 貪婪與非貪婪比對 在R語言中,正規表達式預設(default)會「貪婪」(greedy)地比對。這是什麼意思呢? 舉例來說: str_ext...

鐵人賽 AI & Data DAY 12
用R語言玩轉文字探勘 系列 第 12

技術 [Day 12] R語言中的文件資料結構

文件資料結構 文件資料結構介紹 這個章節會相對抽象一些。若你只是單純處理「文字資料」,例如選舉資料中的候選人欄位用 character 儲存,就比較不會遇上這個...

鐵人賽 AI & Data DAY 3
用R語言玩轉文字探勘 系列 第 3

技術 [Day 3] 使用R語言的文字探勘框架 - quanteda

背景 續前一篇文章,我們談了如何利用tidytext處理「歷年總統國慶大會演說」資料,這篇文章我們同樣會利用相同資料,只是從tidytext改成使用quante...

鐵人賽 AI & Data DAY 25
用R語言玩轉文字探勘 系列 第 25

技術 [Day 25] 利用R語言跑詞嵌入模型 - 原理與 skipgram

詞嵌入模型 詞嵌入模型簡介 想像一下,你有一堆文字,比如說一篇文章、一個推文或一個評論。你的目標是讓電腦理解這些文字中的意義或情感,但問題是,電腦不懂語言,它只...