iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 24
0
AI & Data

AI初見 從零開始的TensorFlow生活系列 第 24

DAY24 - 二元分類問題 - 寶可夢對戰預測 - 2

  • 分享至 

  • xImage
  •  

大家好,昨天看過了「Pokemon-Weedle’s Cave」資料集,知道其中有哪些資料,今天要對這些資料進行分析。

首先匯入套件,讀取和觀察資料一樣是使用pandas函式庫的方法:
import pandas as pd
再來讀取pokemon.csv和combats.csv的資料:

pokemon_df = pd.read_csv('pokemon.csv')  
pokemon_df.head()
combats_df = pd.read_csv('combats.csv')  
combats_df.head()

https://ithelp.ithome.com.tw/upload/images/20201004/20112114nVWkINa5qL.jpg
https://ithelp.ithome.com.tw/upload/images/20201004/20112114TN19lEiUrq.jpg
然後把pokemon.csv中的”#”資訊設為索引值:

pokemon_df= pokemon_df.set_index("#")
pokemon_df.head()

https://ithelp.ithome.com.tw/upload/images/20201004/20112114ctZAKYR7ry.jpg
接著檢查資料是否有缺失:

pokemon_df.info()
combats_df.info()

https://ithelp.ithome.com.tw/upload/images/20201004/20112114oLrwtfUyUX.jpg
https://ithelp.ithome.com.tw/upload/images/20201004/20112114KLnVK6XGKR.jpg
其中pokemon.csv的Name和Type 2有缺失資料,Name的資料在訓練時不會使用,不影響訓練結果,不過Type 2就會有影響,所以需要進行資料的填補。
先查看Type 2資料每個類別有多少,在value_counts方法中傳入dropna=False參數,可以把缺失的資料算入,以NaN表示。
pokemon_df["Type 2"].value_counts(dropna =False)
https://ithelp.ithome.com.tw/upload/images/20201004/20112114kY0RfcTz7f.jpg
缺失的資料代表寶可夢沒有第二個屬性,所以就用'empty'填補缺失:

pokemon_df["Type 2"].fillna('empty',inplace=True)
pokemon_df["Type 2"].value_counts()

https://ithelp.ithome.com.tw/upload/images/20201004/20112114gry26C7O7n.jpg


上一篇
DAY23 - 二元分類問題 - 寶可夢對戰預測 - 1
下一篇
DAY25 - 二元分類問題 - 寶可夢對戰預測 - 3
系列文
AI初見 從零開始的TensorFlow生活30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言