Hi!大家好,我叫史丹利,是一位.NET工程師,希望用30天和大家一起複習陌生的R語言和厲害的機器學習技術。
和R語言見面前,我得先重新淺淺的認識機器學習。
一種讓機器從資料中學習而得到了預測未來的能力。
其實機器學習在80年代就出道成為藝人了,算是80後,搭上這幾年硬體儲存以及運算效能大幅進展的列車,雲端、大數據(Big Data)先火紅了5~6年,當收集的數據越來越完整,人工智慧事務所下的機器學習能提供的決策資訊就更精確到位,而她就在這幾年快速重新的竄紅並且有著難以想像的創新。
因為機器學習的文藝復興,資料採礦(Data Mining)傳統習慣使用的統計作法,也有機會運用更多機器學習演算法來運算海量資料,找出商業金礦。
機器學習復興的三傑,Big Data、Open Data及深度學習。
*2001年有兩部裘德洛的電影: 大敵當前、AI人工智慧。
相較機器學習,R語言是90後,一開始的發展在統計軟體,除了也受惠硬體提升,還更多演算法工程師、數學家及統計學家開發的套件貢獻,讓R語言也和Python一樣在數據分析界受到歡迎。
見識過幾種古老的商業程式語言(Assembly、Cobol)的經典,但其實自己2年多前才第一次聽到了陌生的R語言,讓我們來認識一下對我們很新穎的她。
R語言是由紐西蘭奧克蘭大學的統計系教授 George Ross Ihaka 和Robert Clifford Gentleman在90年代初期開發,也因此稱為R。
R語言本人生活照一張:
R語言是一種直譯式語言,主要用命令列操作。
感覺撰寫R類似在寫Powershell,指令可以一行一行的互動執行,更厲害的是全域變數(global variable)還可以緩存一陣子。
R語言是一個免費的自由軟體: Open Source! 也可以在多種平台下執行(Linux、MacOS、Windows)。
平時的工作是負責一套金融支付系統解決方案(Solution)的研發及維護,基本的工作目標就是把交易快速以及正確的處理,有時使用者有著許多統計、圖表甚至預測數據的需求,但個資要ETL到倉儲又有些資安的限制以及效能的考慮,這時候如果有具備進階分析(OLAP)功能的線上交易資料庫(OLTP) ,也許我們就能更即時提供商業上的決策建議。
這個期待,就在2015年微軟把Revolution Analytics公司併購後看到了可能,微軟團隊除了把R語言也整合進Visual Studio,在最新版本的SQL Server 2016中,也同時建置了In-DataBase R服務了! 未來CIF(Customer information file)、交易資料不用出機器,就可以完成訓練模型並且即時使用模型。
在iT邦幫忙鐵人賽30天中,想試著從.NET工程師的角度使用微軟工具Visual Studio先複習R語言以及簡單的機器學習演算法,一天複習一點,希望能給已經是.NET工程師的成員和朋友一起接觸厲害的R語言,Day01先計畫題綱:
鐵人賽Big Data組遇到了機器學習的老師了!很榮幸和他一起參加!志在完賽!
加油!明晚再見!
微軟整頓R語言產品線大改名,還免費開放R伺服器
http://www.ithome.com.tw/news/103244
文藝復興的起源地:
2011.10攝於florence,Italy