講到大數據就免不了提及一些演算法,但在我們開始介紹演算法之前,先介紹在數據中各種距離代表得含義
嚴格上來講閔可夫司機距離不算一種距離,而是一組距離的定義
兩組?維變數及間的閔可夫司機距離定義為:
其中p是一個變參數
根據變參數的不同,閔可夫基斯距離可以表示一種距離
歐氏距離(L2範數),來自歐氏空間中的兩點間的距離公式
用python實現歐氏距離:
import numpy as np
def get_dist(a, b):
"""
a: A點
b: B點
"""
return np.sqrt(sum(np.power((a - b), 2)))
if __name__ == '__main__':
a = np.array([1, 2, 3])
b = np.array([1, 2, 3])
print(get_dist(a, b)) # 0
a = np.array([1, 2, 3])
b = np.array([3, 1, 5])
print(get_dist(a, b)) # 3.0