Baseball Reference (簡稱:BR) 是在 2000 年由 Sean Forman 在他讀博士期間所建立的棒球數據網站。後來 2004 年 Fo...
今天要來看 pybaseball 的原始碼,來知道他們是怎麼取得大聯盟的 Statcast 資料。 Leaderboard 首先想先介紹怎麼獲得 Savant...
今天跟一位資深的外商產品經理聊天,我們聊到每個產品經理都需要對自己的產品負責,但是如果只看一個最關鍵的指標會是什麼呢? 如果看錯指標,就會導致產品經理的策略與方...
在前面幾天,介紹了 Statcast 各方面的應用,裡面也提到很多進階數據。今天就會再把一些我認為特別或是重要的數據,再做更詳細的講解。一樣會分打擊、投球與守備...
前幾天陸續介紹了 Statcast 的打擊、投球與守備等數據方法,今天會把剩下還沒介紹的一起補完,會有跑壘相關數據,還有上次在 Day 12 - Statcas...
除了打擊跟投球有各種細項,Baseball Savant 同時也提供了關於守備的數據細項給我們查詢。今天就來介紹那些細項,還有 pybaseball 的 met...
昨天介紹完打擊,今天接下來介紹投球,不過其實大多數的參數都滿像的,但投手的 methods 多打者滿多的,一起來瞧瞧吧。 statcast_pitcher 跟昨...
跟 FanGraphs 一樣,Statcast 資料也有做分類,今天會先來介紹打擊相關的 methods。 statcast_batter 用來獲得單一打者的逐...
介紹完 FanGraphs 後,接下來介紹 Statcast。Statcast 是 2015 年大聯盟在 30 支球隊的球場開始啟用、用來獲得球員各種逐球數據的...
終於介紹完所有有關 FanGraphs 的使用方法,以及相關進階數據的說明。今天想帶大家來看 pybaseball 的原始碼,看看他們是怎麼取得 FanGrap...
國外各大數據網站都有推出各自的數據指標,FanGraphs 當然也是不例外。這篇文章會介紹一些可以使用之前所介紹過的方法來取得,並且是我個人認為在 FanGra...
在介紹今天的主題前,想補充昨天提到的 month 這個參數。在昨天的文章裡我有提供一項 官方文件 來介紹在使用上應該填入的值。我昨天的介紹是需填入特定的月份,但...
pitching_stats 昨天介紹打擊,今天就要來講投球了。他們使用的參數都一樣,因為是爬同一個連結下的資料,比較大的差異就是他回傳的欄位會變成跟投球相關的...
昨天介紹了 FanGraphs 這個網站,讓大家對這個數據網站有的資訊有初步的了解。今天會從 pybaseball 上的 FanGraphs 打擊資料開始介紹。...
簡介 FanGraphs 是在 2009 年由 David Appelman 所創立的棒球資訊網站,上面除了提供棒球相關的歷史數據之外,也有聘請專業分析師,以部...
在正式開始介紹數據功能前,我想先介紹 pybaseball 的球員 ID 搜尋功能。因為各大網站辨別球員的方式會有所不同,所以我們需要先獲得相對應的球員 ID...
昨天簡單介紹了 pybaseball,接下來我會介紹平常使用的開發環境與工具,希望能讓大家在起步用 Python 進行棒球分析更順利。 Jupyter Note...
動機 這是我第一次參加鐵人賽,參賽的動機是因為最近參加了由台灣棒壘球科學研究會舉辦的棒球數據競賽,雖然最後很可惜沒有入圍決選,但也因而知道了有許多不一樣的人們有...
Excelize 是 Go 語言編寫的用於操作 Office Excel 檔案基礎庫,基於 ECMA-376,ISO/IEC 29500 國際標準。可以使用它...
終於迎來最後一天了!沒想到這天的到來會讓人如此感動這三十天,每一天都在吸收、成長,並且「學著如何寫出一篇篇教導他人的文章」。以下來跟大家說說又過了30天的心路歷...
先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...
在倒數兩天,接著就要跟大家Say Goodbye了,那在完賽前,要跟大家說說以下幾個事項: 鐵人賽中,參考什麼打出這些內容? 範例中,給大家使用的資源從何處來...
倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...
處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...
索引過程 我們介紹過DataFrame表現得既像二維數組又像由共同的索引值組成的Series對象的字典。這能幫助你學習如何在DataFrame裡面進行數據選擇。...
於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...
從 Numpy 到 Pandas 的過程 NumPy 的數據結構為數據分析不可少的功能,雖然 ndarray 的功能已經很強大,但是當我們需要更多的靈活性的時候...
經過上一篇文字預處理後,我們會得到一行行的文本內容,但這樣對於機器學習來說是無法好好讀取訊息的,所以要將這些單字轉換成數值,以便後續操作。來!我們快點開始動手實...
在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...
從實作回到理論 你知道,在過去25天中,我們從最初的 Kaggle 進行資料 Insign 尋找,我們解析了各式不同的資料類型,並且找到合適的方法將他做分析。後...