DAY24 - 二元分類問題 - 寶可夢對戰預測 - 2 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

第 12 屆 iThome 鐵人賽

DAY 24

AI & Data

AI初見從零開始的TensorFlow生活系列第 24 篇

DAY24 - 二元分類問題 - 寶可夢對戰預測 - 2

12th鐵人賽

yu890709

團隊今晚我想來點程式碼

2020-10-04 23:10:35

1232 瀏覽

分享至

大家好，昨天看過了「Pokemon-Weedle’s Cave」資料集，知道其中有哪些資料，今天要對這些資料進行分析。

首先匯入套件，讀取和觀察資料一樣是使用pandas函式庫的方法：
import pandas as pd
再來讀取pokemon.csv和combats.csv的資料：

pokemon_df = pd.read_csv('pokemon.csv')  
pokemon_df.head()
combats_df = pd.read_csv('combats.csv')  
combats_df.head()

然後把pokemon.csv中的”#”資訊設為索引值：

pokemon_df= pokemon_df.set_index("#")
pokemon_df.head()

接著檢查資料是否有缺失：

pokemon_df.info()
combats_df.info()

其中pokemon.csv的Name和Type 2有缺失資料，Name的資料在訓練時不會使用，不影響訓練結果，不過Type 2就會有影響，所以需要進行資料的填補。
先查看Type 2資料每個類別有多少，在value_counts方法中傳入dropna=False參數，可以把缺失的資料算入，以NaN表示。
pokemon_df["Type 2"].value_counts(dropna =False)

缺失的資料代表寶可夢沒有第二個屬性，所以就用'empty'填補缺失：

pokemon_df["Type 2"].fillna('empty',inplace=True)
pokemon_df["Type 2"].value_counts()

DAY23 - 二元分類問題 - 寶可夢對戰預測 - 1

DAY25 - 二元分類問題 - 寶可夢對戰預測 - 3

系列文

AI初見從零開始的TensorFlow生活共 30 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

97 組

團體組數

3 組

累計文章數

146 篇

最後報名日

9/15

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

ChatGPT Business & Codex 如何從零開始?

IT邦幫忙

AI初見 從零開始的TensorFlow生活系列 第 24 篇

DAY24 - 二元分類問題 - 寶可夢對戰預測 - 2

尚未有邦友留言

標記使用者

AI初見從零開始的TensorFlow生活系列第 24 篇