AI的概念最早在1950年提出,接者ML在1950~1960年提出,NLP在也同ML,緊接者DL在1940~1950年。三者的關係AI是其他三者的父集合,接者ML,其次DL。
早在1950年Alan Turning提出所謂的「圖靈測試」,這是最早提出的AI概念,所謂的「圖靈測試」就是:1個提問問題,二間房間分別為:1個人在內;1台機器在內。然後將問題分別交給房間內的人與機器回答,讓提問者區別出哪個是人類回答,哪個是機器回答。
最早出現的歷史:
ML的早期研究包括羅森布拉特(Frank Rosenblatt)的感知器(Perceptron),這是一種早期的神經網絡模型。
NLP的早期系統如SHRDLU,展示了基本的語言理解能力。
DL初期的神經網絡研究,包括McCulloch和 Pitts的人工神經元模型,這是種從感知器延伸過來的靈感,人類透過想像大腦神經元是如何傳導訓息,模擬出來的,很有趣吧!因為沒有人真正了解大腦是如何運作的。
所謂的程式設計,就好比一個工廠,廠房內部一定有生產線,生產線的管路是可以調整今天要生產的產品品質,成品等。生產線是由技師負責操作指揮工人。而程式設計產生的成品(程式碼)就如同生產線,程式設計師就是工廠的技師。
Data(資料):一般可以區分為清整前,清整後:我們稱之為資料經過ETL(extract transform load,ETL)處理步驟
清整前:為「髒」資料,因為資料可能是你從網路上爬下來的資料,或是公司其他部門同事提供,或是問卷調查蒐集的資料。ex.資料中的性別欄位,很可能除了男與女之外,還有人填了其他,或空白,這時候就考驗你處理資料的能力,是直接刪除該筆資料嗎?但資料很珍貴,除了有失真的考量,你也可以依照你所屬的domain know 判斷或依照業界習慣,自行或參考公司內部規定。
清整後:資料蒐集處理不易,如何將資料變成「有價值 value」的資訊,就考驗你處理資料的功力。