在這個演算法當道的時代每一家網路公司在想辦法儘量的搜集使用者的資訊不論是蘋果限制臉書獲取使用者的資料還是Google花大筆鈔票買下Safari預設搜尋引擎的位置...
我們昨天提到了資料的類型,那今天就來講一講資料的尺度(Scale)先釐清一下這邊所提到的尺度不是指什麼數量級的那種而是指要如何比較與操作一個數值的衡量尺度 什麼...
前兩天我們稍微說明了一下對於看待資料的一些基本觀念那今天就來開始實際對資料做一些操作吧 環境需求: python程式環境 程度需求: 對python有基...
前一天我們介紹了用來資料處理最基本的pandas套件那今天我們則是來談一下不同的檔案類型 我們都知道不同的檔案後綴表示不同的類型但是面對那些txt, csv,...
第三天我們簡單介紹了處理表格的pandas套件接下來就要開始對資料進行處理了我們都知道電腦比起人類來說,最大的優勢就是可以快速的執行相同的操作因此學會如何對大筆...
在處理資料的過程中很常會需要面對到將兩筆分開處理好的資料合併起來的情況因此今天就來談一下在python中要如何對常見的那些資料類型進行合併吧 不是這種合併...
有的時候我們處理資料難免會遇到需要篩選的時候畢竟總不可能隨時都一句「我全都要」吧 我全都要(圖片來自網路) 因此我們今天來談一下在python中那些對資料進...
在用numpy和pandas處理資料的時候我們很常會遇到需要nan的情況而最初在處理它的時候,就因為要判斷相等的方式用錯而繞了不少彎路 我當初就是這個表情...
昨天我們講了在numpy中NaN要如何判斷相等那今天就來稍微談一下會出現缺失值的那些情況要怎麼處理 基本上我們的處理方式不外乎兩種——填和刪 填上資料 方法一:...
前一天,我們簡單討論了一下面對缺失值資料的處理那今天就反過來討論一下面對資料中有重複的情況應該要怎麼處理好了 list元素去重 使用set——不維持原來順序 利...