Pandas匯入CSV檔 # 載入pandas import pandas as pd if __name__ == "__main__"...
安裝 pip install matplotlib 折線圖 # 從matplotlib套件載入類別pyplot from matplotlib import p...
今天要正式來實踐資料清理,資料源是台中市政府資料開放平台的公有零售市場每日蔬果價格填報連結在這 載入資料 import pandas as pd import...
今天要來解決空缺的部份,我們要使用的素材如下,是一張每隔五分鐘就紀錄溫度的資料表,我結圖整張表最上面的一小部份,可以看出表中有幾格空缺解決空缺的部份有許多手段,...
ARIMA模型 ARIMA模型是一種時間序列分析模型,想要了解它就必須先聽聞過另外三種知名的時間序列分析模型 自回歸模型-AR模型 移動平均模型-MA模...
講到大數據就免不了提及一些演算法,但在我們開始介紹演算法之前,先介紹在數據中各種距離代表得含義 閔可夫基斯距離(Minkowski Distance) 嚴格上...
曼哈頓距離(Manhattan Distance) 假設你要從家裡走到學校,行徑的距離肯定不會是兩點間直線的距離,肯定是要經過各種路口轉彎直走才會到達學校,而經...
tags: tags: 2021IT #18數據上的各種距離(3) 夾角餘弦(Cosine) 幾何中的夾角餘弦可用來衡量兩個向量方向的差異,當兩個向量的方向重合...
tags: tags: 2021IT 傑卡德相似係數(Jaccard Similarity Coefficient) 傑卡德相似係數:兩個集合$A$和$B$...
tags: tags: 2021IT 了解隨機性 從整體上觀察矩陣(集合)中的物件分佈與矩陣整體的關係。把機率簡單瞭解為事件發生的可能性,但這只是機率的表面現象...