iT邦幫忙

dataanalysis相關文章
共有 22 則文章
鐵人賽 自我挑戰組 DAY 17

技術 Day 17|資料合併的三種常用語法

  在茫茫數據海當中,資料散布在各種不同的地方,可能是資料庫、網站、文件等,為了要有效統一資料集,方便後續的分析和報告,資料合併的操作是不可不學的,以下將以案例...

鐵人賽 自我挑戰組 DAY 16

技術 Day 16|自定義轉換必學的apply()函數

  在昨天標籤編碼法(Label Encoding)的舉例中,我們可以透過 sklearn 中的函數 LabelEncoder 將類別型態轉為數值型態,那大家是...

鐵人賽 自我挑戰組 DAY 13

技術 Day 13|資料清理-刪除篇

  在處理資料集時,資料清理是不可或缺的步驟,刪除不需要的數據或特徵以確保數據的品質是常見的操作,本文將說明資料清理中有關刪除的操作方法,內容包含: 刪除缺失...

鐵人賽 自我挑戰組 DAY 11

技術 Day 11|資料快速排序操作

  完成資料篩選後,我們可以針對特定欄位進行排序,幫助我們快速整理與觀察,以下將透過案例替大家介紹兩種資料排序的方式,內容包含: 根據數值(value)排序...

鐵人賽 自我挑戰組 DAY 10

技術 Day 10|資料的篩選與過濾

  在進行大量的資料處理時,有時會需要取得符合特定條件的資料,以利後續的觀察與操作,此時就會使用到資料篩選和過濾的技能,今天將以案例搭配 loc[] 函數和大家...

鐵人賽 自我挑戰組 DAY 9

技術 Day 9|資料運算的常見函數

  資料的運算除了基本的加減乘除之外,也能透過函數快速觀察和取得常見的統計值,完成資料匯總,以下將以實例介紹六種常見函數,包含: 最大值與最小值 資料加總與筆...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8|資料運算的加減乘除

  資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7|新增 Series 或 DataFrame

  嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6|實戰讀取並觀察外部資料

  在進行數據分析前,需要先了解資料的內容,以利後續資料清理、特徵工程等處理,因此本篇將延續昨日主題,以實際案例實作一次讀取外部資料,並使用基本語法觀察資料內容...

鐵人賽 自我挑戰組 DAY 5

技術 Day 5|檔案路徑與存取外部資料

  Pandas 的優勢在於可以處理大型數據,方便使用者觀察和分析,但處理數據前需要先載入資料,因此,本文將說明如何透過檔案路徑讀取外部資料,內容包含: 介紹...

鐵人賽 自我挑戰組 DAY 4

技術 Day 4|資料結構 - DataFrame 篇

  上一篇文章中,介紹了 Pandas 中的 Series 結構,今天要和大家聊聊 Pandas 中最常使用的資料結構——DataFrame,其概念和操作都和...

鐵人賽 自我挑戰組 DAY 3

技術 Day 3|資料結構 - Series 篇

  學習撰寫程式時,常會遇到資料結構(Data Structure)這個詞彙,指的是如何用最有利的型態儲存或組織資料,並將其存在記憶體當中,以便電腦更有效率的使...

技術 JCAATs 提供一種更有效的方法來對數據資料進行集群(Cluster)?

JCAATs- AI 稽核軟體的機器學習指令 CLUSTER 命令俱備有很強大的非監督式學習功能!這個強大的工具使用進階得機器學習演算法來識別模式並根據相似性對...

技術 免費票║AI Experience Worldwide兩日線上全球大會

分享免費線上活動 由DataRobot舉辦,內容與AutoML 與 Advanced Analytics相關 光看邀請到的Keynote Speaker,覺得跟...

Towards Tensorflow 2.0 系列 第 5

技術 [Day-5] Python視覺化實戰

由於不管是在做model或者分析人員視覺化都是非常重要的,因此今天會來說一些視覺化工具,一樣主要會使用三個資料集: 看劇資料 (CRM資料) 股票資料 (時間...

鐵人賽 Data Technology DAY 15
使用Python進行資料分析 系列 第 15

技術 [Day15]Numpy操作索引&局部資料!

嗨!終於來到了1/2路程了,今天會繼續來說明Numpy的索引以及資料切割。 若是想看其他Numpy的介紹: [Day14]Numpy的ndarray!...

鐵人賽 Data Technology DAY 11
使用Python進行資料分析 系列 第 11

技術 [Day11]Pandas使用多層索引!

嗨,時間來到第11天了!我們在昨天(Day10)提到了groupby,第9天說明了索引的操作,那今天要繼續index這個主題繼續延伸說明多層索引! 首先要開始之...

鐵人賽 Data Technology DAY 10
使用Python進行資料分析 系列 第 10

技術 [Day10]Pandas Groupby使用!

嗨!今天是第十天了,沒想到自己竟然撐到1/3了,還記得我們在上一篇說明了索引的各種設定運用,接下來就來聊聊Groupby是什麼吧! Splitting the...

鐵人賽 Data Technology DAY 9

達標好文 技術 [Day09]Pandas索引的運用!

上一篇說明了運用不同的方式做資料的過濾,透過過濾不需要的資料進而取出我們所要的資料,接下來要來嘗試索引(index)的更多使用的方法! 將column變成ind...

鐵人賽 Data Technology DAY 4

技術 [Day04]Python的基本運算!(下)

今天第四天了! 在上一篇,說明了python各個數據類型的使用函式,接下來我會介紹流程控制以及迴圈應用,有流程控制我們可以讓程式加入判斷,決定要執行哪些程式碼!...

鐵人賽 Data Technology DAY 3

達標好文 技術 [Day03]Python的基本運算!(上)

今天是第三天! 在上一篇瞭解了jupyter notebook的操作使用,這一篇跟下一篇會用來說明python的基本語法,使用Jupyter notebook。...

鐵人賽 Data Technology DAY 2

達標好文 技術 [Day02]Jupyter Notebook操作介紹!

第二天了!昨天介紹了如何安裝Anconda,因為接下來我都會使用Jupyiter notebook做程式編寫,還沒有安裝好環境的話趕快看一下上一篇 [Day01...