上篇文章有簡單提及Machine Learning的定義:
Machine Learning:Algorithms whose performance improve as they are exposed to more data over time.
(一種可以隨著時間和資料去完善它的成果的演算法)
也有兩種較為詳細的定義分別由Arthur Samuel (1959)和Tom Mitchell (1998)提出:
Machine Learning is the field of study that gives the computer the ability to learn without being explicitly programmed. -Arthur Samuel
(機器學習是一種賦予電腦一種學習能力卻沒有明確撰寫程式的研究領域)
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. -Tom Mitchell
(一個程式可以由經驗E去完成任務T得到成果P,經過成果P可以在任務T中獲得更多經驗E)
也可以用圖形化來表示這樣的一種迴圈式學習:
1.當人類沒有相關經驗時
2.當人類不知該如何描述經驗時
3.解答會隨著時間變化
4.解答只適用於特定案例
DataSet是指資料包含Example和其中的Attribute。
Example是指一組資料列,Attribute是指資料的欄位也包含了機器學習所需的輸入和輸出。
範例如下:
Attribute分為兩種資料類型:Categorical values(分類值)和Numeric values(數值)。