Google對於TensorFlow教學提供了視覺化的工具TensorBoard,也同時做了網站來說明神經網路,對應資料分布類型也至少有四大類,很適合初學者了解,也很適合有實作經驗者重新思考何為神經網路的內涵。
這是神經網路中其中一種資料分布型態,而Google也(好心地)把可能地組合型變數提供在下面了。
稍微思考一下,似乎用來分類地判定平面(或線)是一條曲線,或更精準地說,是個圓!?
我們可以發現,描述該切割面的方程式為一個最高次項為2的方程式。
這時候肯定有幾個問題冒出來了:
都可以相乘了,那麼用來描述該平面可以用更高次項的方程式嗎?
可以,頂多就是過擬合呀?
過擬合在前面的分享有提過,容易導致訓練時效果好但是一進入測試階段就效果低落的狀況。
用更高次項的方程式不能說不行,但容易出現過擬合及訓練時程拖長(因為有更多的可能性)。
該怎麼選可能的bucket數量來應對可能的Feature Crosses?
多做吧!
這是一門藝術(課程裡面說的)。
在課程當中由於已經被設定好了,看起來理所當然;實際上可以透過收集資料並反覆觀察,判斷收集到的資料偏誤狀況,加以決定可能的測試量。