今天是假說檢定基礎的最後一堂,跟大家把型一誤和型二誤講得更完整,另外也和大家介紹檢定統計量這個名詞。接下來會正式介紹很常見的假說檢定方法,先從Z檢定和T檢定開始...
看起來很廢話但是很實際 使用套件前,要先安裝套件 安裝完成之後要使用套件要先載入套件library(套件名稱)接著才能使用套件中的函式,不然R會報錯 goo...
昨天和大家介紹了卡方的適合度檢定,今天要把另外兩種的獨立性及同質性檢定和大家介紹。明天開始會用實際案例,和大家講解如何計算檢定統計量,以及查表做結論。 原影片網...
這幾天介紹完了有關Z檢定和T檢定的理論與計算方式,今天和明天兩堂課要以R語言為例教大家用程式進行操作。今天要先介紹的是單一樣本的檢定,舉的例子是和投影片一樣的平...
今天以實際的資料進行F檢定的運算,以及R語言的操作給大家看。在做兩樣本T檢定前,是一個很重要的步驟。明天開始會進入新的主題,是ANOVA分析,同樣是統計和資料分...
您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 (延續昨天) #演算法 library(ClusterR) opt_gmm = Optimal_Clust...
今天是迴歸分析的第2堂,要和大家介紹的是模型是如何找到參數的估計值。其中提到的殘差的觀念,是所有分析方法都一定會評估的指標之一。明天會進入實際操作的課程,以R語...
今天會以實際案例的計算,將One-way ANOVA做一個段落。我們同樣以平均薪資做為範例,這次有使用實際資料帶入,教大家如何得到3種變異,以及如何使用R快速的...
在電腦中的資料單位 1個0或1 =>一個位元(bit) 8個0或1 =>一個位元組(Bytes) 1024個位元組 =>1KB 1024KB...
您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## 應用四: 建構特徵 #### # 用GMM,產出數值+類別型特徵 library(naniar)...
這是關於在 hahow-開啟資料科學的學習大門 - R入門教學-課程的心得。 Day1 關於R R由統計學家所開發,第一版本於1995年發布。由於是統計學家所開...
昨天初步介紹了假說檢定中的虛無假說和對立假說,今天要講的是假說檢定的種類,依據敘述的內容可以簡單分為三種。另外,也和大家解釋了型一誤 (Type I error...
今天開始是最後的一個主題,要講的是迴歸分析的基礎。迴歸分析是大多數統計分析、機器學習課第一個會講的模型,許多模型的開發都是基於迴歸的基礎而來的。接下來幾天,會講...
把卡方檢定的理論部分講解完後,今天是用R語言來操作的課程。這幾天講到的卡方檢定的例子都有以程式的方式呈現,以及解釋報表結果。接下來幾天會進到新的檢定方法,例如F...
每一個動作都是函數語法A::install.packages("aa")A->套件名稱:: ->分隔符號install.pac...
上一堂課,帶大家了解了常見的幾個統計圖表,今天會使用R內建的幾個資料集,為大家示範如何用R快速的畫出這些圖形。 原影片網址:https://youtu.be/g...
講解完3種卡方檢定的理論後,今天以實際案例帶大家如何計算。其中同質性檢定因為時間關係就沒有介紹,但計算方式是一樣的,大家有興趣的話可以再多找一些相關資料補充!明...
統計圖表,顧名思義是將數據運用圖像來呈現,以此清楚描繪資料的現象,獲取更多資訊,進而作為資料分析的基礎。今天的影片介紹了5種常見的統計圖表供大家參考和學習,下一...
今天以平均身高為例,帶大家來看實際案例的計算。當中也教了大家如何進行查表,以及p-value的概念。明天會以T檢定的為例,同樣以實際案例來將檢定方法講得更詳細。...
昨天簡單介紹了如何用R快速畫圖,今天除了補充了一個新的統計圖表之外,也將R中畫圖的參數講得更仔細一些。這應該是繪圖的最後一堂課,當然功能上遠不只是影片提到的這些...
昨天和大家介紹了怎麼使用R操作單一樣本的Z檢定和T檢定。今天要講的是用兩樣本的例子,使用的例子是投影片中也提到過的。 原影片網址:https://youtu.b...
背景 開發者們打造許多套件,替人們處理文字探勘。有些針對特定任務,例如在主題模型章節中我會介紹stm、LDA,在詞向量章節中則以gensim、word2vec為...
利用R語言分詞 分詞流程 - 利用 quanteda library(quanteda) # Chinese stopwords ch_stop <- q...
文字探勘簡介 這個系列的文章以文字探勘為主題,會介紹文字探勘的原理、在文字探勘過程中要注意的事情,並以R語言為背景,帶大家實作,而且會有很貼近生活的案例。 文字...
正規表達式 在利用文字探勘技術,完成讓人看完眼睛為之一亮的分析之前,我們要先確保資料集的品質足夠優異,否則只會應驗時常聽到的名言:「garbage in, ga...
主題模型 主題模型比較 前一篇介紹如何用 LDA 的 R 程式碼,製作主題模型,這篇文章則要展示如何利用變化版的 STM。 想像一下,LDA 就像是一個喜歡「貼...
文字探勘應用案例 應用案例 - 總統國慶致詞 我們來運用前面的技術來個應用案例,廢話不多說直接開始。 這次步驟有幾個:從維基文庫利用爬蟲爬下資料 -> 清...
利用R語言分詞 利用R語言分詞 - 預處理 上面有提到,在斷詞前其實有些任務要先進行,我們結合dplyr和stringr,再搭配其他套件展示具體怎麼做吧! #...
字串處理情境介紹 文字探勘的諸多應用如情緒分析、文本分類,聽起來都很美好,但在分析資料以前,首先要有乾淨資料。舉例來說,若我們想分析歷屆台灣總統的演講稿,在事前...
R語言中的字串資料 前面章節「總統演說」的範例中,能看到R語言中常見的文字資料格式,要不是儲存在dataframe中,每筆資料都是文章、段落、句子,或者是用li...