有個數據每0.001秒記錄一次 我要使用PCA降維再用c-means
我使用sklearn 只拿前一小部分來測試
PCA的部分
我想取每5分鐘 就是每300000 取一次 最大的值 前30個值跟後100個值
但我不知道如何把這想法加進去!請問有特定語法嗎或更好的想法?
如果我不使用這想法直接嘗試spark PCA 這樣是不是資料還是蠻龐大的 比較不建議?
資料大概長這樣
time number
0.001 0.01
0.002 0.03
0.003 0.12
0.004 0.16
.. ..