iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 10
0
AI & Data

AI&Machine Learning系列 第 10

Data 大數據(儲存資料)探討

  • 分享至 

  • xImage
  •  
本文將會對於我們所介紹的儲存資料做一個探討動作,在上次儲存資料有提到,利用 Excel 檔案格式儲存下來,利用儲存下來的Excel檔案,來看出最後的結果或者是做分析都比較方便,因為如果檔案不以Excel 方式取下來也是可以,但是其他的檔案大部分都是 word 形式,對於觀看上以及分析上就會比較困難,所以才會使用Excel檔案格式,因為Excel 就是一個很完美的表格形式的檔案。

那對於Excel 儲存下的檔案,我們儲存的時候需要注意什麼呢?基本上只要搞清楚表格的參數就可以讓自己的Excel檔案非常的好看。

藉由 https://medium.com/pyradise/%E7%94%A8-python-%E8%88%87-excel-%E6%89%93%E9%80%A0%E7%B0%A1%E6%98%93%E7%9A%84%E5%9B%9E%E6%B8%AC%E7%B3%BB%E7%B5%B1-%E4%B8%8B-82a2c658ce3 參考資料顯示,儲存上的資料為了要做區分以及要做分析使用,對於儲存裡面的資料要進一步的處理,有時候我們把模組的方式很開心的裝進去了,都儲存成功了,結果打開資料發現,資料怎麼這麼多我怎麼知道哪個是我要的,所以這個時候就是針對之前儲存的資料方式就很重要,我們在先前儲存的時候就可以先把行列定義清楚,這個部分本人我一直強調很多次,因為曾經本人也做過許多次,都把資料抓下來確認完將資料變成Excel時,會跟本人分析的時候都不一樣,真的造成很大的問題,後來慢慢養成習慣最好在儲存之前就讓Excel整個表格行列定義完成,這樣當儲存檔案完成時,打開檔案的時候會很清楚這份檔案的各個位子意思為何。

例如:假設今日是在找一份將拍賣網站下來的資料,你一定要知道名稱,價錢,細項等等,然後你的列應該要為序號的感覺,但是往往你在抓資料下來進去之後她不會知道你這麼多的狀況,所以這時候必須要定義 Excel 中以 python來說要用 index 以及 column 參數。

好的 那以上為這次不專業的AI介紹,本次的儲存資料其實探討的點有點少,因為本人也有發現這部分好像沒甚麼好探討的,還請各位見諒,也謝謝各位觀看,那我們下篇見。

預告:下一篇 機器學習(Machine Learning)整體主軸與概念。

上一篇
Data 大數據(彙整資料)探討 補充 Day 9
下一篇
(不專業的AI介紹) 機器學習-Machine-Learning 基礎介紹 Day11
系列文
AI&Machine Learning30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言