iT邦幫忙

0

資料清理儲存問題

我目前把NAN跟重複資料都清除了。我把2G多的txt分成多個csv。
1.各位大大請問:
用panda處理完之後但我疑問是怎麼儲存呢?
還是每次都要打開jupyter notebook 的專案,我知道怎麼清理但看不懂大家清理完,儲存 成新的csv嗎?還是有別的方法?
2.但我之後結合一次不能打開2G的我的記憶體不夠。有人推薦使用MongoDB 但儲存超過0.5G就 需要收費的意思?我想使用coogle cloud裡的工具有人有推薦或使用過的嗎?

圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 個回答

0
最佳解答

我是說「本機端」的mongodb。請下載mongodb安裝在自己電腦,至於安裝教學已經有很多人寫,上網找一下就有了。

你用雲端的mlab才有0.5G的限制

0
暐翰
iT邦大師 1 級 ‧ 2018-04-07 00:48:18

有人推薦使用MongoDB 但儲存超過0.5G就 需要收費的意思?

mongodb是免費的
官網內容(圖)

想使用google cloud什麼功能DB、VM?

我是說「本機端」的mongodb。請下載mongodb安裝在自己電腦,至於安裝教學已經有很多人寫,上網找一下就有了。

我要發表回答

立即登入回答