在實作推薦系統時,會遇到一個問題:到底要蒐集哪些特徵資料給系統做學習呢?
這已經不是演算法的問題了,這是系統營運上的問題。這問題也考驗著推薦系統的設計者,到底有多了解系統的使用場景,以及有多了解自家產品的使用者。
拿我們這系列一直以來要做的事:影片推薦來說,會有多少因素決定使用者看這部影片?
拿我自己當例子,會讓我想看這部影片的因素有:
這樣,對應的特徵就有
那這樣就夠了嗎?
還可以記錄使用者在挑影片時的瀏覽軌跡
除了自己找特徵外,這邊也列出了常用的特徵,在設計系統時,可以提早蒐集。
以上在設計系統時,可以參考來設計