iT邦幫忙

pandas相關文章
共有 175 則文章
鐵人賽 AI & Data DAY 6

技術 Day06 Pandas skills: Data Wrangling. Pandas操作:資料角力

資料角力(有時也稱為資料改寫),簡單來說是將資料整理成合乎需求的格式,以利後續視覺化或者套用機器學習模型。今天要來介紹一些運用Pandas操作進行資料角力的方式...

鐵人賽 AI & Data DAY 5

技術 Day05 Pandas skills: read in files. Pandas操作:讀取不同格式

先來介紹如何讀入(.csv)檔、以及Pandas一些基本常用指令解說:The first part will be about how to read in (...

鐵人賽 AI & Data DAY 4

技術 Day04 Outlier and some Numpy. 離群值與Numpy操作

在蒐集資料的過程中,可能會因測量方法、人為疏失或實驗誤差等,導致所蒐集到的資料中出現個別值極度異於其它資料的值,即為離群值(Outlier);離群值可能導致分析...

鐵人賽 AI & Data DAY 3

技術 Day03 Pandas DataFrame, Label Encoding and One Hot Encoding. Pandas基本資料類型、標籤編碼與獨熱編碼

編寫程式碼時,載入已經存在的套件能幫我們節省下許多時間,又載入套件時,常有許多約定成俗的縮寫方式,需要稍微注意一下。不僅是為了簡短程式碼,也為了日後能順利閱讀討...

技術 資料分析套件-pandas-profiling

緣起 每拿到新資料時,總用pandas做一些重複性的探勘工作,今天發現一個好套件-pandas-profiling,套件作者覺得describe實在是太陽春了,...

技術 [Python] pandas_profiling DataFrame 詳細資料分析視覺化

大家使用Pandas DataFrame分析不外乎就是使用內建的describe(),如果要其他分析就需要再手動進行,再利用繪圖package視覺化。 今天分享...

技術 [Python] Pandas df.iterrow 平行處理

#import pakage import pandas as pd import multiprocessing #指定主機有多少CPU,並把df 平均分配...

技術 [Python] Pandas 小記錄

pd.set_option('display.max_rows', 500) pd.set_option('display.max_columns', 500)...

技術 [Python] Pandas 並列(同時)顯示DataFrame

平常在使用Jupyter notebook時,一個cell 只能顯示一個DataFrames利用自製Class 可以同時顯示多個DataFrames clas...

鐵人賽 自我挑戰組 DAY 3

技術 [第三天] Pandas 練習

鳶尾花資料集 昨天導入鳶尾花資料集,今天就再詳細的了解一下這個資料的描述吧。當然這個資料集是dict格式(可以花時間了解一下字典格式) from sklearn...

鐵人賽 Data Technology DAY 21
使用Python進行資料分析 系列 第 21

技術 [Day21]Pandas就能輕易將資料視覺化!

今天是第21天了!前兩天說明了matplotlib是如何將資料視覺化的,今天就要來看看如何用Pandas就可以將資料視覺化! 首先,先import import...

鐵人賽 Data Technology DAY 12
使用Python進行資料分析 系列 第 12

技術 [Day12]Pandas處理字串資料!(上)

嗨,今天是比賽的第12天,也是2017的最後一天,跨年還要寫這個真的是難過。那來說一下字串的資料是如何處理、可以如何處理吧!這邊我會將處理字串分成上、下兩個部分...

鐵人賽 Data Technology DAY 10
使用Python進行資料分析 系列 第 10

技術 [Day10]Pandas Groupby使用!

嗨!今天是第十天了,沒想到自己竟然撐到1/3了,還記得我們在上一篇說明了索引的各種設定運用,接下來就來聊聊Groupby是什麼吧! Splitting the...

鐵人賽 Data Technology DAY 9

達標好文 技術 [Day09]Pandas索引的運用!

上一篇說明了運用不同的方式做資料的過濾,透過過濾不需要的資料進而取出我們所要的資料,接下來要來嘗試索引(index)的更多使用的方法! 將column變成ind...

鐵人賽 Data Technology DAY 8

達標好文 技術 [Day08]Pandas資料的取得與篩選!

嗨,今天第八天了,最喜歡8這個數字了!(題外)上一篇說明了如何讀取檔案還有pandas內的函式,包含查看資料內容、資料選擇、新增、刪除、空白填充以及排序。pan...

鐵人賽 Data Technology DAY 7

達標好文 技術 [Day07]Pandas操作資料的函數!

嗨嗨!第七天了,上一篇提介紹了python內的一個套件pandas內兩個重要的資料結構,可以到這邊回顧:[Day06]Pandas的兩種資料類型! 接下來要會介...

鐵人賽 Data Technology DAY 5

技術 [Day05]聊聊重要的三個package吧!

嗨,來到第五天啦!在昨天終於放晴了是好天氣呢!第四天與第三天我們學會了怎麼使用python,要開始資料分析的部分了。今天,這個美好的平安夜來聊聊python數據...

鐵人賽 AI & Machine Learning DAY 14

技術 Pandas(Python中的Excel)Day4-DataFrame的新增、迴圈與刪除

提醒: 本篇文章的code在這裡: Titanic 新增資料 新增資料有兩種可能的意思: 要新增column或是要新增row,在pandas可透過concat完...

鐵人賽 AI & Machine Learning DAY 13

技術 Pandas(Python中的Excel)Day3-DataFrame的索引與更新

提醒: 本篇文章的code在這裡: Titanic DataFrame的索引 pandas好用的原因其中之一就是其索引的功能非常強大,相比於sql語法要敲一長串...

鐵人賽 AI & Machine Learning DAY 12

技術 Pandas(Python中的Excel)Day2-DataFrame的資料描述與屬性

前言 接下來為了讓大家有實際操作的機會,我將以kaggle中Titanic練習資料集作為示範,詳細的內容請自行詳閱比賽中的資料介紹頁面。另外,由於後續的文章應該...

鐵人賽 AI & Machine Learning DAY 10

技術 Pandas(Python中的Excel)Day1-資料類型與讀寫檔案

前言 Pandas作為Python最強大的表格處理工具,其操作上非常簡單、方便,也很彈性。所謂簡單,指初學寫程式的人也容易快速上手。所謂方便,指程式碼很短、很簡...

鐵人賽 Big Data DAY 17

技術 [第 17 天] 資料角力

我們現在面對表格式資料(Tabular data),Excel 試算表,JSON 或者網頁資料時有了相當程度的自信,透過 pandas、requests 與 B...

鐵人賽 Big Data DAY 15

技術 [第 15 天] 載入資料

截至目前為止我們在學習筆記練習的資料結構,不論是 Python 內建的 list,tuple 或 dictionary,還是引用 numpy 套件與 panda...

鐵人賽 Big Data DAY 14

達標好文 技術 [第 14 天] 常用屬性或方法(3)Data Frame

除了 Python 基本的資料結構(list,tuple 與 dictionary)以及昨天學習筆記提到的 ndarray,還記得我們在 [第 06 天] 資料...

鐵人賽 Big Data DAY 6

技術 [第 06 天] 資料結構(3)Data Frame

截至 2016-12-06 上午 7 時第 8 屆 iT 邦幫忙各組的鐵人分別是 46、8、12、12、6 與 58 人,我們想要用一個表格來紀錄參賽的組別與鐵...