matplotlab 在資料分析的領域中,圖表一直是重要的工具,這點相信大家也都同意,我們在日常生活中不論是看電視、手機或是報章雜誌,股市從來不會給你看一堆數字...
讓你的matplotlab更美麗 可能會有人覺得圖表這種東西只要看得懂就好,在工程師眼中的確是沒問題,畢竟我們繪圖只是想檢視圖表有無異常明顯的趨勢或異常,只要看...
今天我們要正式來實踐資料清理,資料源是台中市政府資料開放平台的公有零售市場每日蔬果價格填報連結在這 載入資料 import pandas as pd impor...
今天來教學異常檢測,一張表要是有異常值的話,分析出來的數值可能也會是異常的,所以一定要去除異常值我們先把昨天的過濾出的資料匯出成CSV檔,我們一共保留了4個欄位...
柴比雪夫不等式 今天我們來講數學,我們來介紹機率與統計一個很有名的公式,柴比雪夫不等式,它長這樣這公式不長,但也夠折騰人了,我們先說明一下柴比雪夫不等式的概念...
今天我們要來練習異常值去除,我們會使用柴比雪夫不等式的原理來操作,在這之前要先思考一件事,異常值去除後,原來的位置要填什麼呢?是補0嗎?還是填一個空值None?...
今天我們要來模擬基於柴比雪夫不等式的異常值檢測,首先我們先用NumPy產生一條隨機亂數 import pandas as pd import numpy as...
今天我們要來解決空缺的部份,我們要使用的素材如下,是一張每隔五分鐘就紀錄溫度的資料表,我結圖整張表最上面的一小部份,可以看出表中有幾格空缺解決空缺的部份有許多手...
昨天我們發現,過多的樣本反而會對估計做出反效果,因此我們今天要來縮小樣本來補值,說到縮小樣本,就不得不提到鼎鼎大名的KNN演算法,又稱為K-近鄰演算法、最近鄰居...
在時間序列分析中相當有名的一個數學模型,差分整合移動平均自迴歸模型,又名為ARIMA模型,我們就來介紹這東西吧 ARIMA模型 ARIMA模型是一種時間序列分析...