iT邦幫忙

數據分析相關文章
共有 170 則文章
鐵人賽 AI & Data DAY 5

技術 Ɖ5-根/ 鐵達尼號的 Python 的資料型態應用

如果用 Python 處理鐵達尼號的資料會是什麼樣子? 前幾篇文章的內容中我們已經利用 Excel 來處理鐵達尼號的資料集,試著判斷出不同的標頭資料,也進行了樣...

鐵人賽 AI & Data DAY 25

技術 Ɖ25-布朗尼/ Numpy 多維陣列呈現

布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...

鐵人賽 AI & Data DAY 28

技術 〔Day28〕看看Orange將故事或文章分類的小技巧吧!

倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...

鐵人賽 自我挑戰組 DAY 30
print("Hello Tableau Public") 系列 第 30

技術 [Tableau Public] day 30:數據領域工作所需要的技能

我們前面所練習的資料視覺化在數據領域中比較偏向後段的工作。 一個完整的數據分析專案(數據團隊)包括了以下五個環節:1.取得原始資料2.清理原始資料3.模型訓練/...

鐵人賽 AI & Data DAY 16

技術 〔Day16〕探索新插件-Bioinformatics

今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~ 安裝並重新開啟 首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的...

鐵人賽 AI & Data DAY 24

技術 〔Day24〕零程式的圖像分析(二)-Classification

在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...

鐵人賽 AI & Data DAY 8

技術 Ɖ8-根/ 鐵達尼號的 Python 自訂特徵與異常值處理

現有特徵 Feature 自今我們已經介紹了樞紐分析來進行分組與分類,相關性可視化降低對於數據解讀的難度,學會了許多應用數據的方法,此外我們還有一種選擇是放棄特...

技術 FineReport10.0的這12個更新,能讓你的工作效率提高3倍!

產品的反覆運算更新除了要滿足更多的使用場景,很多時候也是為了優化某些功能,尤其是一些細節方面的優化,往往能帶來工作效率的極大提升。 比如已經升級FineRepo...

鐵人賽 Software Development DAY 2

技術 Day 02 - 環境設置

昨天簡單介紹了 pybaseball,接下來我會介紹平常使用的開發環境與工具,希望能讓大家在起步用 Python 進行棒球分析更順利。 Jupyter Note...

鐵人賽 AI & Data DAY 29

技術 Ɖ29-布朗尼/ Pandas 的缺失值處理與應用

處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...

鐵人賽 AI & Data DAY 14

技術 Ɖ14-香料/ pd.merge 資料檔案合併分類計算

文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...

鐵人賽 AI & Data DAY 2

技術 Ɖ2-根/ 推論計算台北市一共有幾隻鳥

Becoming a Data Scientist 剛剛其實有提到,解構問題並且從中找到 Insight 是分析師最重要的能力,所以在做分析時必須理解到你要分析...

鐵人賽 AI & Data DAY 22

技術 Ɖ22-溫沙拉/ 進階樞紐匯出報表

樞紐匯出表 Reports from Pivot Table 上一篇關於數據透視表的文章描述瞭如何使用 pandas 的 pivot_table 功能將數據以一...

鐵人賽 AI & Data DAY 26

技術 Ɖ26-布朗尼/ Numpy 常見四大類型介紹

從實作回到理論 你知道,在過去25天中,我們從最初的 Kaggle 進行資料 Insign 尋找,我們解析了各式不同的資料類型,並且找到合適的方法將他做分析。後...

鐵人賽 AI & Data DAY 17

技術 Ɖ17-香料/ Excel 的進階尋找過濾

進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...

鐵人賽 AI & Data DAY 15

技術 Ɖ15-香料/ 快速尋找與過濾

尋找與過濾 Filter and Edit 最近有朋友跟我說我前陣子寫的關於 Pandas 中常見的 Excel 文章,對於幫助新的 Pandas 用戶將 Ex...

鐵人賽 AI & Data DAY 27

技術 Ɖ27-布朗尼/ Pandas 的數據結構 Series 與 Datafram

從 Numpy 到 Pandas 的過程 NumPy 的數據結構為數據分析不可少的功能,雖然 ndarray 的功能已經很強大,但是當我們需要更多的靈活性的時候...

鐵人賽 Software Development DAY 3

技術 Day 03 - 球員 ID 搜尋

在正式開始介紹數據功能前,我想先介紹 pybaseball 的球員 ID 搜尋功能。因為各大網站辨別球員的方式會有所不同,所以我們需要先獲得相對應的球員 ID...

鐵人賽 Software Development DAY 8

技術 Day 08 - FanGraphs 進階數據解釋

國外各大數據網站都有推出各自的數據指標,FanGraphs 當然也是不例外。這篇文章會介紹一些可以使用之前所介紹過的方法來取得,並且是我個人認為在 FanGra...

鐵人賽 Software Development DAY 6

技術 Day 06 - FanGraphs 投球篇

pitching_stats 昨天介紹打擊,今天就要來講投球了。他們使用的參數都一樣,因為是爬同一個連結下的資料,比較大的差異就是他回傳的欄位會變成跟投球相關的...

鐵人賽 Software Development DAY 4

技術 Day 04 - FanGraphs 介紹

簡介 FanGraphs 是在 2009 年由 David Appelman 所創立的棒球資訊網站,上面除了提供棒球相關的歷史數據之外,也有聘請專業分析師,以部...

鐵人賽 AI & Data DAY 16

技術 Ɖ16-香料/ 進階尋找與過濾

進階試算表工作 Advance Excel Tasks 上篇以 Excel 中的 Filter 函數為模型,說明各種 Pandas 索引方式,這篇文章中將重點介...

鐵人賽 AI & Data DAY 19

技術 Ɖ19-溫沙拉/ Excel 試算表上的簡單樞紐分析

樞紐分析表 Pivot table 樞紐分析表(Pivot Table)又被稱為資料透視表,是用來匯總不同列表的數據,把表進行分組(Grouping)並且對各個...

鐵人賽 AI & Data DAY 28

技術 Ɖ28-布朗尼/ Pandas 的索引探討與應用

索引過程 我們介紹過DataFrame表現得既像二維數組又像由共同的索引值組成的Series對象的字典。這能幫助你學習如何在DataFrame裡面進行數據選擇。...

鐵人賽 Software Development DAY 15

技術 Day 15 - Statcast 進階數據解釋

在前面幾天,介紹了 Statcast 各方面的應用,裡面也提到很多進階數據。今天就會再把一些我認為特別或是重要的數據,再做更詳細的講解。一樣會分打擊、投球與守備...

鐵人賽 Software Development DAY 5

技術 Day 05 - FanGraphs 打擊篇

昨天介紹了 FanGraphs 這個網站,讓大家對這個數據網站有的資訊有初步的了解。今天會從 pybaseball 上的 FanGraphs 打擊資料開始介紹。...

鐵人賽 Software Development DAY 30

技術 Day 30 - 如何在 pybaseball 貢獻與鐵人賽總結

終於來到鐵人賽的最後一天,最後就來介紹要如何貢獻 pybaseball 跟我這次鐵人賽的心得,為這次的鐵人賽畫下句點。 Contribution 想要貢獻開源的...

鐵人賽 Software Development DAY 11

技術 Day 11 - Statcast 打擊篇

跟 FanGraphs 一樣,Statcast 資料也有做分類,今天會先來介紹打擊相關的 methods。 statcast_batter 用來獲得單一打者的逐...

鐵人賽 Software Development DAY 23

技術 Day 23 - Top Prospects

介紹完主要的數據網站的 functions 後,接下來會再用一些篇幅把剩下的沒介紹的分享完,有些會連著原始碼一起介紹。今天先來介紹 top_prospects...

鐵人賽 Software Development DAY 9

技術 Day 09 - FanGraphs 原始碼

終於介紹完所有有關 FanGraphs 的使用方法,以及相關進階數據的說明。今天想帶大家來看 pybaseball 的原始碼,看看他們是怎麼取得 FanGrap...