最後讓我們來回顧一下課程中提到那些內容吧
在 regression 中除了理解它是什麼之外,我們透過不同的模型來深入探討
像是如何處理多個特徵?還有如何透過最佳化演算法來更加擬合模型,如何使殘差平方合最小化
最後我們知道要如何衡量代價?怎麼選擇模型來避免過度擬合
在 Classification 的課程中我們學到了如何用 Linear classifiers 來分類,並且針對多種特徵的情形下,該如何建立一個適合 classifiers
學到了不同的概念,然後試著將不同的模型混合再一起(正反向加上機率)
前面雖然學會了 Classification,但在這個章節有更深入的討論,我們會發現在 document retrieval 中
比如我們想到分類的時候,一個文件不會只有單一的種類,它可能包含多個話題(科技與金融、政治與體育...)這樣的模型該怎麼處理呢?
就演算法來說,我們理解到各種搜尋資料中最有效的方法,不同的演算法對應各種不同的情形
還有該如何分類一些資料量特別大的文件
在推薦系統的例子中不僅僅限於 Collaborative filtering 和 Matrix factorization
還會提到高維度的資料和如何用低維度來建模
我們要學會的重要概念當我們想到矩陣因式分解時我們得做矩陣填充,填充那些未知的部分
還有 cold-start 在系統對新產品或新使用者一無所知道情況下要如何進行推薦
最後一個項目我們將建立一個推薦系統、包含了評價的分析和搜尋不同圖片時的計算機視覺功能,還要加上深度學習
接著你只要把它運作在建立的網頁上,它就是一個合用的半成品了
本來想說這最後一個章節省略掉,然後來用最少的 library 刻一個 cnn algorithm
然後用它來對接之前的資料來對比直接用人家寫好的跟自己刻的到底效能如何
不過在截稿之前還是有些bug沒辦法修好,現在腦袋已炸裂
因此只好認輸了...
於是只好把這門課最後一個篇幅切成兩篇(一開始是打算剩下的兩篇一篇刻演算法一篇寫心得的)
眼下還有很多要努力的地方,而這個部份也只能暫時告一段落:D