iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 24
0
Google Developers Machine Learning

初心者的GDC攻略系列 第 24

Day24: Feature Crosses 二訪

既然是非線性項,那需要多複雜?

Google對於TensorFlow教學提供了視覺化的工具TensorBoard,也同時做了網站來說明神經網路,對應資料分布類型也至少有四大類,很適合初學者了解,也很適合有實作經驗者重新思考何為神經網路的內涵。

https://ithelp.ithome.com.tw/upload/images/20191010/20120151hwhpV1dAOr.png
這是神經網路中其中一種資料分布型態,而Google也(好心地)把可能地組合型變數提供在下面了。
稍微思考一下,似乎用來分類地判定平面(或線)是一條曲線,或更精準地說,是個圓!?
我們可以發現,描述該切割面的方程式為一個最高次項為2的方程式。

這時候肯定有幾個問題冒出來了:

  1. 都可以相乘了,那麼用來描述該平面可以用更高次項的方程式嗎?
    可以,頂多就是過擬合呀?
    過擬合在前面的分享有提過,容易導致訓練時效果好但是一進入測試階段就效果低落的狀況。
    用更高次項的方程式不能說不行,但容易出現過擬合及訓練時程拖長(因為有更多的可能性)。

  2. 該怎麼選可能的bucket數量來應對可能的Feature Crosses?
    多做吧!
    這是一門藝術(課程裡面說的)。
    在課程當中由於已經被設定好了,看起來理所當然;實際上可以透過收集資料並反覆觀察,判斷收集到的資料偏誤狀況,加以決定可能的測試量。


上一篇
Day23: Feature Crosses
下一篇
Day25: TensorFlow Transform
系列文
初心者的GDC攻略30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言