iT邦幫忙

2023 iThome 鐵人賽

DAY 4
0

簡介

FanGraphs 是在 2009 年由 David Appelman 所創立的棒球資訊網站,上面除了提供棒球相關的歷史數據之外,也有聘請專業分析師,以部落格文章的方式,分享他們運用這些數據的研究,或是一些最新的數據模型跟排名方法。是一個值得探索與取經的專業網站。

不只大聯盟的數據,他們也提供最新的潛力新秀數據 The Board,方便球探或有興趣的球迷在上面關注那些未來新星的最新資訊。此外,由於美國對夢幻球隊 (Fantasy Baseball) 的遊戲盛行,他們也提供相關的分析文章收錄在 RotoGraph 裏面。

排行榜 Leaderboards

在 pybaseball 裏面所用的資料,是從他們一個叫做 Leaderboards 的頁面進行爬蟲來獲得裡面的相關資料。今天就會來簡單介紹這個頁面有哪些功能我們可以使用,然後在之後的篇章會再更詳細的解釋我們要如何用 pybaseball 來幫助我們更方便快速地運用這些數據。注意這邊的預設排名會是用 FanGraphs 他們自己計算出的指標 WAR 來排名,之後會做他的詳細介紹,有興趣想先知道也可以參考他們官方的解釋。Link

基本介面

篩選器 Filter

進入頁面就能看到一個大大的選單 (下圖),這個就是用來篩選資料的工具,可以透過操作上面的欄位來獲得過濾或排序過後的資料。

從選單最上面的部分開始由上往下一一介紹:

  • Leaderboards 與 Splits Leaderboards:這項目簡單來說分成基本模式數據分項模式,預設是基本模式。在分項模式下可以根據不同數據做更詳細的篩選搜尋,藉此來獲得更細節或專門的數據統計,因為 pybaseball 目前只能抓取基本模式的資料,並且分項模式的內容實在太龐大,所以這次的介紹會都先停留在基本模式,如果對分項模式有興趣可以點入連結試試。
  • Stats:分成 Player (球員)Team (球隊)League (聯盟),根據選項會有不同項目的總和資料,這邊選聯盟的話要注意會是大聯盟全部總合而非分美聯國聯。預設為球員數據。
  • 投打守:選擇要看哪個大方面的統整,分成 Batting (打擊)、Pitching (投球)Fielding (守備)。預設為打擊。
  • 聯盟/球隊細項:可以用 League (聯盟) 來篩選是 National League (國聯) 還是 American League (美聯),或是選擇特定球隊。Split Teams(隊伍分項) 這個選項我不確定功用,我預設是要根據選的隊伍分別顯示,但我勾選後還是只能選一個隊伍。Active Roster (現役球員)HOF (名人堂) 只能選一個,如果都沒選結果會跟選 Active Roster 一樣。選 HOF 的話系統會自動把球季區間改成 1871 - 2023 年。
  • 守位:可以根據選取的守備位置篩選,這邊要注意會根據投打守而有所變換,另外畫面中的 NP 我不知道是甚麼意思,目前看起來跟全選是一樣的結果。預設是全選 (All)
  • 球季/時間細項與最小打席數:這部分可以選特定一季 (Single Season) 的成績,或是用 Split 去選更細的時間區間,因為選項眾多我就不一一介紹。另外一個是最小打席數 (Min PA),預設是 Qualified ,這個意思是說有符合打擊獎項的打席數,也就是說要至少 3.1 * 球隊出賽數的打席數才符合。注意這邊也是會根據投打守會有不同顯示,如果投手就是 MinIP (最小投球局數),如果是選守備則是 MinInn (最小局數)
  • 自選時間區間:選擇客製化的日期區間,或是選取多數賽季,會自動算總和。
  • 年齡:最後一欄是選擇年齡,最大值是 58,最小值是 14,如果超過就會自動調整成預設值。

數據表格

介紹完了篩選器,接下來看我們篩選完的結果,這邊我先顯示預設的搜尋結果。

可以看到這邊也有選項可以做選擇,主要分成兩大類:

Stats (數據):包含基本數據以及一些比較常見的進階數據,並另外細分成九種不同類別,會根據選擇的類別有不同的欄位,因為所含的欄位眾多,會有各種不同的數據名詞,之後會有另一篇介紹與整理一些在 FanGraphs 上常見的進階數據。有興趣的也可以先參考 FanGraphs 官方提供的名詞解釋:

攻擊數據投球數據防守數據

Pitch Types (投球類別):主要根據投球內容的數據統計,內容種類也是十分詳細,會有球種比例,或是投球的位移量 (Movement),還有打者的本壘板紀律 (Plate Discipline),一樣也是後面會挑幾個介紹。

這些選項都選完後可以看到 FanGraphs 會產出一個表格,可以調整最多一頁顯示多少筆資料 (Page Size)。如果有加入他們的會員的話,可以把這個表格輸出。

客製化選項

最後一個部分,FanGraphs 也提供使用者客製化自己需要的欄位,或是自己選擇需要留下哪些特定球員的資料。

  • 客製化欄位:左邊是所有可以顯示的欄位名稱,右邊是最後客製化後會顯示的欄位名稱。可以選擇一個項目後,用左右箭頭操控位置,也可以用上下調整順序,在右邊選擇項目也可以按 X 取消顯示。完成選取後點選 Create Custom Table (製作客製化表格),網頁就會刷新並顯示最新選取的資料。
  • 客製化球員:點取 Add Players (新增球員) 並輸入你要的球員姓名後選取,他會被加進下方的區域,可以選取多位球員,一樣按 X 取消選取。結束選擇後,點選 Create Custom Player List (製作客製化球員名單),網頁就會只留下你所選取的球員資料。

本日小結

今天簡單的介紹 FanGraphs 這個網頁有哪些資訊,還有主要在 pybaseball 使用的 Leaderboards 功能與操作,資訊很多,感謝大家的耐心地看完。

很推薦大家可以實際去按按看 Leaderboards,還有關注一些在 FanGraphs 上面的文章,對於喜好棒球跟數據分析的同好們一定會收穫良多。

因為內含的各種數據名詞實在太多,要是每個都介紹可能會需要更多篇幅,所以打算之後會整理一篇介紹我覺得比較特別或是常見的給大家認識。如果有哪個有特別想了解的也可以留言跟我說,我會再看要怎麼放在文章裡面,或是我有什麼遺漏或錯誤的,也歡迎留言提醒我,。下一篇會介紹 pybaseball 裡運用到 FanGraphs 資料的打擊篇。


上一篇
Day 03 - 球員 ID 搜尋
下一篇
Day 05 - FanGraphs 打擊篇
系列文
Python 棒球數據分析套件 pybaseball 介紹30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言