語言是最自然不過的溝通方式,早在1950年間科學家 Alan Turning就開始設計一個簡單的問題測試day2,讓提問者猜哪一間是人類,哪一間是機器。這個機器回答問題的方式,是根據問題文句的上下文,還是單詞出現的頻率。如何讓機器能夠精準的抓到問題的所在進而回答問題。是資料科學家感興趣的問題。
學到了第24天終於要進入NLP的世界。在這之前我們學習的都是處理類別catalog或是數值numbers的資料。現在開始對詞句的部分做處理分析。
明天我們會從NLP的文字前處理談起,並補充關於機器學習如何如處理data的方法:
接下來,再談ML可能會遇到的問題與簡單談談DL的原理,並介紹影像處理RNN與CNN等。或是你有希望我要談什麼內容,歡迎留言給我。
最後一天,我們將會總結一下這30天的學習歷程,未來還要可以朝向哪方面發展,給予自學者的建議,敬請期待。