iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
自我挑戰組

終極大數據地獄 系列

這是折磨

參賽天數 24 天 | 共 24 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文 團隊NUTC_IMAC_NEW
DAY 11

#11 Pandas教學3

Pandas匯入CSV檔 # 載入pandas import pandas as pd if __name__ == "__main__"...

DAY 12

#12 matplotlab教學

安裝 pip install matplotlib 折線圖 # 從matplotlib套件載入類別pyplot from matplotlib import p...

DAY 13

#13 資料清理教學

今天要正式來實踐資料清理,資料源是台中市政府資料開放平台的公有零售市場每日蔬果價格填報連結在這 載入資料 import pandas as pd import...

DAY 14

#14 補值教學

今天要來解決空缺的部份,我們要使用的素材如下,是一張每隔五分鐘就紀錄溫度的資料表,我結圖整張表最上面的一小部份,可以看出表中有幾格空缺解決空缺的部份有許多手段,...

DAY 15

#15 ARIMA教學

ARIMA模型 ARIMA模型是一種時間序列分析模型,想要了解它就必須先聽聞過另外三種知名的時間序列分析模型 自回歸模型-AR模型 移動平均模型-MA模...

DAY 16

#16 數據上的各種距離(1)

講到大數據就免不了提及一些演算法,但在我們開始介紹演算法之前,先介紹在數據中各種距離代表得含義 閔可夫基斯距離(Minkowski Distance) 嚴格上...

DAY 17

#17 數據上的各種距離(2)

曼哈頓距離(Manhattan Distance) 假設你要從家裡走到學校,行徑的距離肯定不會是兩點間直線的距離,肯定是要經過各種路口轉彎直走才會到達學校,而經...

DAY 18

# 18 數據上的各種距離(3)

tags: tags: 2021IT #18數據上的各種距離(3) 夾角餘弦(Cosine) 幾何中的夾角餘弦可用來衡量兩個向量方向的差異,當兩個向量的方向重合...

DAY 19

#19數據上的各種距離(4)

tags: tags: 2021IT 傑卡德相似係數(Jaccard Similarity Coefficient) 傑卡德相似係數:兩個集合$A$和$B$...

DAY 20

#20 數據中的機率性(1)

tags: tags: 2021IT 了解隨機性 從整體上觀察矩陣(集合)中的物件分佈與矩陣整體的關係。把機率簡單瞭解為事件發生的可能性,但這只是機率的表面現象...