執行程式 R 執行程式一般都是使用 Rstudio,可以使用左上角執行程式檔,也可以使用左下角的互動模式。另外,這次鐵人賽有看到蠻多組也是在講 R 程式設計的,...
機器學習演算法 在機器學習這個主題中,一開始先介紹了什麼事機器學習,他在資料科學中扮演什麼樣的角色。接著,簡單說明兩個基礎的演算法「線性回歸」與「邏輯回歸」。不...
機器學習 機器學習是從人工智慧這門學科延伸出來的分支,主要是透過演算法試圖從資料中「學習」到資料的規律,用來預測資料的特性。 與資料探勘,統計分析的異同 機器學...
正所謂人在江湖飄,哪有不挨刀,身為.NET工程師三不五時會翻MSDN書櫃,操作就是 滑鼠點選2下 + 熱鍵 F1 ;但在R語言除了Google搜尋,也要學會C...
如果有真的在做資料科學的朋友對這個演算法大概也不陌生。 通常會在剛入手資料的時期用PCA看看資料的樣子,這是在探索式資料分析當中常常會用的手法,看不出個所以然的...
Spark 1.6版時提出了新的stateful函式:mapWithState。本篇延續之前的範例,然後介紹mapWithState。 我們建立了兩個RDD:...
人們每天上傳至雲端的檔案數量,多達一億張相片、十億份文件… 更別提數位影音、交易、生物醫療… 每天全球所創造的資料量高達2.5艾位元組(exabyes, 即10...
黑色好看版 - 傳送門 前面幾篇文章我們說明完了分片的運用後,我們接下來,就來實際的模擬個情景,我們來學習要如何的一步一步完成,咱們選擇的模擬情境為股價應用,...
延續先前的範例,假設我只想看見一點的股票交易資料勒?例如: 最近一個小時內,總交易次數總為何?交易量最高的五支股票為何? OK,來分析問題。首先每批資料的區...
看完最直接的pattern match基礎應用,稍微講一些周邊作為番外的Ending吧,常常與pattern match一起提到的概念大概有Extrator、C...