iT邦幫忙

0

主成分分析(PCA) python 疑問

有個數據每0.001秒記錄一次 我要使用PCA降維再用c-means
我使用sklearn 只拿前一小部分來測試
PCA的部分
我想取每5分鐘 就是每300000 取一次 最大的值 前30個值跟後100個值
但我不知道如何把這想法加進去!請問有特定語法嗎或更好的想法?
如果我不使用這想法直接嘗試spark PCA 這樣是不是資料還是蠻龐大的 比較不建議?

資料大概長這樣
time number
0.001 0.01
0.002 0.03
0.003 0.12
0.004 0.16
.. ..

看更多先前的討論...收起先前的討論...
froce iT邦大師 1 級 ‧ 2018-05-27 12:07:29 檢舉
1.即時取還是事後分析?
2.中間會不會有跳號的情形?
jaman iT邦新手 5 級 ‧ 2018-05-27 14:34:00 檢舉
事後分析 中間不會有跳號
froce iT邦大師 1 級 ‧ 2018-05-27 15:14:23 檢舉
那你可以試著用pandas的series去做slice來分析。
jaman iT邦新手 5 級 ‧ 2018-05-27 15:35:57 檢舉
恩 我試看看
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友回答

立即登入回答