iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 16
0
AI & Data

Python零基礎到Kaggle 系列 第 16

Python零基礎到kaggle-Day15

今日目標

特徵工程,建模,訓練,預測Part3
Age欄位的預測

看完文章您將學到什麼

如何處理更多缺失值的欄位

內文

Age缺值在Day13知道有263個,在整體1307筆資料中不少,之前提過fare的一個缺值可以直接平均填入,這邊可以用稱謂分組取中位數估計會比較準確,
像Miss,Lady,Mrs...年紀應該差不多
男生稱謂有:
"Mr.", "Sir.", "Dr.", "Major.", "Master."
女生稱謂有:
"Ms.", "Miss.", "Mrs.", "Lady."

各稱謂平均年紀跟存活率可以參考這個

程式撰寫

ㄧ樣會在明天一起展示Day16

反思回顧

還有沒有其他隱藏特徵?
還有其他方法增加OOB嗎?
有除了特徵之外提升OOB的方法嗎?

參考資料

https://medium.com/@yulongtsai/https-medium-com-yulongtsai-titanic-top3-8e64741cc11f


上一篇
Python零基礎到kaggle-Day14
下一篇
Python零基礎到kaggle-Day16
系列文
Python零基礎到Kaggle 31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言