iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 14
0
Google Developers Machine Learning

Google machine learning cloud 實戰系列 第 14

Day 14. Finding Errors in your dataset using Facets

  • 分享至 

  • twitterImage
  •  

Facets是由google所建立的一個資料視覺化工具,我們用UCL census data來做測試,這是一組不記名的美國人的數據集,裏頭紀錄了年齡,收入等等。我們可以清楚的從Facets介面上看到這組資料的相關資訊,像是mean,std,missing...等等,右邊還有一個直方圖,同時畫著training data跟testing data的數據分佈。
Facets也可以根據feature來分別顯示,這邊有給出一個例子,只顯示出年薪的圖表,並用大於50k跟小於50k來做區分,一樣有training data跟testing data。由圖表可以清楚看出,在年薪的training data跟testing data上有著很大的skew。Facets還有著許多的可調整客製化的圖表類型。能顯示的不只是數值化的數據,圖像也可以直接顯示,讓我們可以更輕易的找到錯誤的標籤。


上一篇
Day 13. Evaluating Metrics for Inclusion
下一篇
Day 15. Third Wave of Cloud: Fully-Managed Services
系列文
Google machine learning cloud 實戰30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言