iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 24
0
Big Data

從學生到職場:菜鳥資料科學家的第一個月系列 第 24

淺談機器學習

機器學習

機器學習是從人工智慧這門學科延伸出來的分支,主要是透過演算法試圖從資料中「學習」到資料的規律,用來預測資料的特性。

與資料探勘,統計分析的異同

機器學習、資料探勘、與統計分析是由不同的觀點在看待「資料」的一種技術。隨著技術的演進,不管是哪一門所涵蓋的方法與技術其實越來越相近了!

  • 統計分析:通常會想要利用數學模型去學習資料,找出一組參數來「描述」資料,目標是找出資料背後的分佈解釋資料間的關係。
  • 機器學習:透過抽象模型學習擬合資料,會著重在學習模型的最佳化過程,目標是達到最好「預測」效果。
  • 資料探勘:強調如何透過演算法或步驟,目標是找出最符合資料背後的價值。通常會在意怎樣的資料要怎麼挑選適合的方法。

演算法

在《大演算》這一本書中,將機器學習分成五種角度,分別了來自於不同的思維。

  • 符號理論學派:歸納法 - 從資料反向推導出結論的方法。
  • 演化論學派:遺傳算法 - 透過程式模擬遺傳演化產出最後的結果。
  • 類神經網路學派:透過多層的節點模擬腦神經傳遞的思考。
  • 貝氏定理學派:根據統計學及機率的理論產生模型。
  • 類比推理學派:基於相似度判斷進行推論學習。
      

Reference

  1. 從機器學習談起
  2. 大數據、資料科學、機器學習、資料探勘、統計方法差在哪?

上一篇
資料探勘演算法 - 分群法
下一篇
機器學習演算法 - 線性回歸與邏輯回歸
系列文
從學生到職場:菜鳥資料科學家的第一個月28
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
杜岳華
iT邦新手 5 級 ‧ 2016-12-27 00:05:36

其實機器學習講的不一定是數學模型呢!不過是抽象的模型就是了!
像是kNN就不太需要用數學做描述。

話說我超想買大演算這本書的!!!

WeiYuan iT邦新手 4 級 ‧ 2016-12-27 13:45:30 檢舉

感謝補充!大演算很值得看,蠻值得收藏的!

WeiYuan iT邦新手 4 級 ‧ 2016-12-27 13:46:19 檢舉

@a504082002: 大大會怎麼解釋機器學習、資料探勘,統計分析這三者之間的關係啊?

杜岳華 iT邦新手 5 級 ‧ 2016-12-27 21:58:55 檢舉

之前大致看過機器學習的一些大著
Pattern Recognition and Machine Learning這本已經絕版,不過應該還是可以在天瓏找到,他比較偏向是論文集,他蒐集了很多機器學習相關的模型,所以可以當工具書查查。
An Introduction to Statistical Learning這本專門講統計方面的機器學習模型,深入淺出,比較適合閱讀。
Machine Learning這本我沒看過,但是看蠻多人推荐的。
對我來說,機器學習是一門技術、一門運用模型的技術,他紀錄了人們運用這方面知識遇過的議題、碰到的"坑"、不適用的情況,如何去選一個好的模型跟調整他。

資料探勘大家推的聖經應該是這本Data Mining: Concepts and Techniques
這本蠻適合閱讀的,他以資料處理的角度去看探勘這件事,因為探勘重要的不是挖出結果、也不是用哪個模型,而是挖出資料的流程本身。

最後統計分析我不是那麼熟悉,不過在我的印象裡應該是沒有這樣的一個領域,或是說他指的是統計本身。
如果是指統計的話,統計的觀點應該是了解資料本身,對於萃取出資訊或是知識的話,統計沒有這麼厲害,他可以讓你了解資料的樣貌或是型態,但是通常無法提供太高端的資訊。
這邊拉回到前面的statistical learning,當統計進入到機器學習的領域的時候,可以做的事情就變多了,可以提供的資訊就變豐富了,變得比較高端了。

以上個人淺見,供大家參考

我要留言

立即登入留言