接續上次的文章,今天我們會針對 缺失值 做處理,我們先來看上次的資料最後的型態。 str(full) 我們先用 table 來看一下 Embarked 有幾種...
建立資料倉庫是一個解決企業資料問題應用的過程,是企業資訊化發展到一定階段必不可少的一步,也是發展資料化管理的重要基礎。資料倉庫的知識介紹書籍和文章不少,但是實際...
作者 | Celestine Omin 譯者 | 無明 編輯 | Vincent導讀:ML/AI 當然有它們的用武之地,各大科技公司已經證明了這些技術的有效性。...
大數據時代和智慧時代來臨,企業將數據分析提升到前所未有的重要地位,對數據分析人才的培養和爭奪也十分激烈,但實際的數據專案卻並不是一帆風順。 今天推薦一場活動,像...
昨天介紹了母體和樣本的概念,有了這個基本概念後,今天和大家介紹什麼是參數、統計量。參數和統計量是在做統計推論時非常重要的觀念,絕大多數的統計統計方法都離不開這兩...
前面介紹過的檢定方法像Z檢定和T檢定,是我們對於連續變數的母體平均感興趣時可以使用的。而卡方檢定是適用於類別資料的檢定方法。 今天要講的F檢定,感興趣的目標則是...
一、何謂資料分析 資料分析是一種統計方法,其主要特點是多維性和描述性,有些幾何方法有助於揭示不同的資料之間存在的關係,並繪製出統計資訊圖,以更簡潔的解釋這些資料...
前言 在我們將資料放入機器學習的演算法之前,如何利用程式幫我們準備好資料是重要的,常常聽到 "Garbage in, garbage out"...
建立資料倉庫是一個解決企業資料問題應用的過程,是企業資訊化發展到一定階段必不可少的一步,也是發展資料化管理的重要基礎。 資料倉庫的知識介紹書籍和文章不少,但...
解析生產管理分析的精髓,跟隨BI高手的引導,逐步拆解生產管理流程,揭示資料分析的關鍵要素。 為什麼要進行生產管理分析、生產管理視覺化呢? 用圖表的形式展現生產情...
接續上次(中集)我們所做的事情,我們已經把Age的資料都給補齊了,我們來回顧一下上次最後的資料: str(full) 現在我們想要新增一個新的變數, Chi...
生產排程是管理生產資源與時間的核心工具。它能協助你將有限的資源分配到最適合的生產任務,從而提升效率。有效的生產排程不僅能最大化生產能力,還直接影響作業效率和客戶...
今天正式進入統計上經典的幾個假說檢定方法。首先要介紹的是Z檢定和T檢定,這兩種檢定都是用在檢定母體平均數時的檢定,在實務上非常實用。今天簡單介紹了常態分配和T分...
當我們想了解兩個連續型變數之間的關係時,相關係數是一個常用且可以量化的指標。 相關係數通常指的是皮爾森相關係數(Pearson's correlation...
昨天講解了One-way ANOVA的核心概念,今天要講的是實際計算會運用到的數學式。一共有三種變異要計算,公式以及自由度今天都有介紹給大家,明天會帶入實際案例...
有在做資料分析的朋友,應該很常發生拿到資料不完整的情況,尤其當資料屬於人工維護時,品質會相對比較差,也較容易出現該填寫的地方卻是空值的問題,今天我們就要來針對...
第JCAATs-0002號: 大家好,這是AI稽核軟體JCAATs使用的線上課程,JCAATs 為 AI 語言 Python 所開發的新一代稽核軟體,除具備傳統...
人力資源最佳化是所有公司面臨的問題,如何透過資料分析來進行人力資源最佳化呢?看過各種資料分析文章的HR都知道如何透過資料分析來探究人員結構、員工流失率以及公司考...
昨天介紹完獨立樣本T檢定後,今天接續兩樣本的資料,介紹成對樣本T檢定 (Paired t test)。當我們的兩組資料間是不獨立的情形時,我們可以進行成對樣本T...
今天以T檢定為例,教大家如何進行雙尾檢定以及右尾檢定。由於時間關係,明天才會進行兩個樣本的T檢定。將會介紹兩獨立樣本T檢定以及成對樣本T檢定。 原影片連結:ht...
大數據時代的來臨,使的統計分析相關的能力越趨重要,許多的問題存在於各個領域當中等著被分析、解決......本教學主要針對統計沒有概念的人提供教學,只要每天願意花...
Excelize 是 Go 語言編寫的用於操作 Office Excel 檔案基礎庫,基於 ECMA-376,ISO/IEC 29500 國際標準。可以使用它...
你是否完全不懂Excel,卻還是想做出專業的Excel趨勢圖?不用擔心複雜的操作。Excel的學習曲線很平緩,非常適合初學者。只要跟著本文的步驟進行操作,就能輕...
現在都說,是大數據時代,可是google也不能給我一個通俗易懂的答案:到底什麼是大數據,為什麼會出現這種情況,怎麼處理呢? 起初,資料量很少的時代,通過表格工具...
今天以實際的資料進行F檢定的運算,以及R語言的操作給大家看。在做兩樣本T檢定前,是一個很重要的步驟。明天開始會進入新的主題,是ANOVA分析,同樣是統計和資料分...
結束了Z檢定和T檢定後,今天開始要講的是卡方檢定的內容。Z檢定和T檢定都是用於連續型的隨機變數,例如身高、體重、血壓、......而卡方檢定則是適用於類別計次型...
前幾堂的案例都是講一個樣本的Z檢定或T檢定,今天的課程要講的是獨立樣本T檢定 (two sample t test)。當我們有兩組的樣本,來自不同母體且是獨立的...
假說檢定 (Hypothesis Testing) 是一種統計推論的方法,當我們對某個或某幾個隨機變數的母體參數感興趣時,就可以運用假說檢定的方法。今天跟大家簡...
昨天講解了Z分配和T分配讓大家知道,今天繼續介紹檢定所需的工具,講的是檢定統計量如何計算,以及拒絕域的判斷方式。明天開始會以實際的案例帶大家計算,之後也會有R語...
今天是最後一天的課程,會把迴歸分析告一個小段落。用R語言進行簡單線性迴歸,同樣是使用之前提過的例子做示範。迴歸分析其實是很大的一個學門,這3天講的內容其實非常粗...