iT邦幫忙

數據分析相關文章
共有 186 則文章
鐵人賽 Software Development DAY 17

技術 Day 17 - Baseball Reference 介紹

Baseball Reference (簡稱:BR) 是在 2000 年由 Sean Forman 在他讀博士期間所建立的棒球數據網站。後來 2004 年 Fo...

鐵人賽 Software Development DAY 16

技術 Day 16 - Statcast 原始碼

今天要來看 pybaseball 的原始碼,來知道他們是怎麼取得大聯盟的 Statcast 資料。 Leaderboard 首先想先介紹怎麼獲得 Savant...

鐵人賽 IT管理 DAY 23

技術 [關鍵指標] 身為產品經理,你知道產品最重要的關鍵指標是什麼嗎?

今天跟一位資深的外商產品經理聊天,我們聊到每個產品經理都需要對自己的產品負責,但是如果只看一個最關鍵的指標會是什麼呢? 如果看錯指標,就會導致產品經理的策略與方...

鐵人賽 Software Development DAY 15

技術 Day 15 - Statcast 進階數據解釋

在前面幾天,介紹了 Statcast 各方面的應用,裡面也提到很多進階數據。今天就會再把一些我認為特別或是重要的數據,再做更詳細的講解。一樣會分打擊、投球與守備...

鐵人賽 Software Development DAY 14

技術 Day 14 - Statcast 其他篇

前幾天陸續介紹了 Statcast 的打擊、投球與守備等數據方法,今天會把剩下還沒介紹的一起補完,會有跑壘相關數據,還有上次在 Day 12 - Statcas...

鐵人賽 Software Development DAY 13

技術 Day 13 - Statcast 守備篇

除了打擊跟投球有各種細項,Baseball Savant 同時也提供了關於守備的數據細項給我們查詢。今天就來介紹那些細項,還有 pybaseball 的 met...

鐵人賽 Software Development DAY 12

技術 Day 12 - Statcast 投球篇

昨天介紹完打擊,今天接下來介紹投球,不過其實大多數的參數都滿像的,但投手的 methods 多打者滿多的,一起來瞧瞧吧。 statcast_pitcher 跟昨...

鐵人賽 Software Development DAY 11

技術 Day 11 - Statcast 打擊篇

跟 FanGraphs 一樣,Statcast 資料也有做分類,今天會先來介紹打擊相關的 methods。 statcast_batter 用來獲得單一打者的逐...

鐵人賽 Software Development DAY 10

技術 Day 10 - Statcast 介紹

介紹完 FanGraphs 後,接下來介紹 Statcast。Statcast 是 2015 年大聯盟在 30 支球隊的球場開始啟用、用來獲得球員各種逐球數據的...

鐵人賽 Software Development DAY 9

技術 Day 09 - FanGraphs 原始碼

終於介紹完所有有關 FanGraphs 的使用方法,以及相關進階數據的說明。今天想帶大家來看 pybaseball 的原始碼,看看他們是怎麼取得 FanGrap...

鐵人賽 Software Development DAY 8

技術 Day 08 - FanGraphs 進階數據解釋

國外各大數據網站都有推出各自的數據指標,FanGraphs 當然也是不例外。這篇文章會介紹一些可以使用之前所介紹過的方法來取得,並且是我個人認為在 FanGra...

鐵人賽 Software Development DAY 7

技術 Day 07 - FanGraphs 隊伍篇

在介紹今天的主題前,想補充昨天提到的 month 這個參數。在昨天的文章裡我有提供一項 官方文件 來介紹在使用上應該填入的值。我昨天的介紹是需填入特定的月份,但...

鐵人賽 Software Development DAY 6

技術 Day 06 - FanGraphs 投球篇

pitching_stats 昨天介紹打擊,今天就要來講投球了。他們使用的參數都一樣,因為是爬同一個連結下的資料,比較大的差異就是他回傳的欄位會變成跟投球相關的...

鐵人賽 Software Development DAY 5

技術 Day 05 - FanGraphs 打擊篇

昨天介紹了 FanGraphs 這個網站,讓大家對這個數據網站有的資訊有初步的了解。今天會從 pybaseball 上的 FanGraphs 打擊資料開始介紹。...

鐵人賽 Software Development DAY 4

技術 Day 04 - FanGraphs 介紹

簡介 FanGraphs 是在 2009 年由 David Appelman 所創立的棒球資訊網站,上面除了提供棒球相關的歷史數據之外,也有聘請專業分析師,以部...

鐵人賽 Software Development DAY 3

技術 Day 03 - 球員 ID 搜尋

在正式開始介紹數據功能前,我想先介紹 pybaseball 的球員 ID 搜尋功能。因為各大網站辨別球員的方式會有所不同,所以我們需要先獲得相對應的球員 ID...

鐵人賽 Software Development DAY 2

技術 Day 02 - 環境設置

昨天簡單介紹了 pybaseball,接下來我會介紹平常使用的開發環境與工具,希望能讓大家在起步用 Python 進行棒球分析更順利。 Jupyter Note...

鐵人賽 Software Development DAY 1

技術 Day 01 - 前言與 pybaseball 簡介

動機 這是我第一次參加鐵人賽,參賽的動機是因為最近參加了由台灣棒壘球科學研究會舉辦的棒球數據競賽,雖然最後很可惜沒有入圍決選,但也因而知道了有許多不一樣的人們有...

技術 Excelize 釋出 2.7.1 版本,開源的 Excel 檔案基礎庫

Excelize 是 Go 語言編寫的用於操作 Office Excel 檔案基礎庫,基於 ECMA-376,ISO/IEC 29500 國際標準。可以使用它...

鐵人賽 AI & Data DAY 30

技術 〔Day30〕最後一天!心得回饋與30天連結一次看!!

終於迎來最後一天了!沒想到這天的到來會讓人如此感動這三十天,每一天都在吸收、成長,並且「學著如何寫出一篇篇教導他人的文章」。以下來跟大家說說又過了30天的心路歷...

鐵人賽 AI & Data DAY 30

技術 Ɖ30-結語/ 先別急著停下腳步

先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...

鐵人賽 AI & Data DAY 29

技術 〔Day29〕所有Orange初始教學片中的數據資源包,一次交給你!

在倒數兩天,接著就要跟大家Say Goodbye了,那在完賽前,要跟大家說說以下幾個事項: 鐵人賽中,參考什麼打出這些內容? 範例中,給大家使用的資源從何處來...

鐵人賽 AI & Data DAY 28

技術 〔Day28〕看看Orange將故事或文章分類的小技巧吧!

倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...

鐵人賽 AI & Data DAY 29

技術 Ɖ29-布朗尼/ Pandas 的缺失值處理與應用

處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...

鐵人賽 AI & Data DAY 28

技術 Ɖ28-布朗尼/ Pandas 的索引探討與應用

索引過程 我們介紹過DataFrame表現得既像二維數組又像由共同的索引值組成的Series對象的字典。這能幫助你學習如何在DataFrame裡面進行數據選擇。...

鐵人賽 AI & Data DAY 27

技術 〔Day27〕用線性迴歸預測童話故事的類別-Logistic Regression

於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...

鐵人賽 AI & Data DAY 27

技術 Ɖ27-布朗尼/ Pandas 的數據結構 Series 與 Datafram

從 Numpy 到 Pandas 的過程 NumPy 的數據結構為數據分析不可少的功能,雖然 ndarray 的功能已經很強大,但是當我們需要更多的靈活性的時候...

鐵人賽 AI & Data DAY 26

技術 〔Day26〕看看Orange歸類文本之效果

經過上一篇文字預處理後,我們會得到一行行的文本內容,但這樣對於機器學習來說是無法好好讀取訊息的,所以要將這些單字轉換成數值,以便後續操作。來!我們快點開始動手實...

鐵人賽 AI & Data DAY 25

技術 〔Day25〕文字預處理,過濾多餘的詞-Text

在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...

鐵人賽 AI & Data DAY 26

技術 Ɖ26-布朗尼/ Numpy 常見四大類型介紹

從實作回到理論 你知道,在過去25天中,我們從最初的 Kaggle 進行資料 Insign 尋找,我們解析了各式不同的資料類型,並且找到合適的方法將他做分析。後...