我們昨天已經看過如何在Scala中獨立使用Kafka。以我之前的經驗,Kafka Producer的部份有比較多的可能會與其他系統而不是Spark整合,這時候就...
黑色好看版 - 傳送門 上篇文章我們已經說明完,如何在本機上建立mongodb副本集,而本篇文章,我們將要實際的使用docker來建立有三個節點的副本集,也就...
今天講到最粗淺的MDS,他是Multidimensional scaling的縮寫。 他是做什麼的呢?我們前面有提到,通常在探索資料的時候首先會用PCA的方式,...
這兩天的結果還在跑
操作的部分終於來囉~~~此篇將介紹Transformation的基本操作,分成五個部分: 建立Transformation 儲存Transformation...
我前面有說過我想到甚麼就寫甚麼吧XD 這個主題跟資料科學拉不太上邊,但是跟統計比較相關。但是到後面的幾篇文章就會拉回來了。 什麼是Power law 他其實是一...
Set好環境後,我們來翻閱兵器使用說明書!看看有沒有遺漏的密技可以撿,讓R語言開發時的操作更流暢。 今天會介紹兵器的形制、下載秘笈範例程式,最後複習幾個常用的視...
正所謂工欲善其事必先利其器,選擇一個順手的兵器是攻城獅很重要的準備工作。 撰寫R通常都用R Studio,用起來也很方便;不過對.NET工程師來說,心中兵器排行...
分類法 分類法(Classification)是資料探勘與機器學習中重要的算法。分類主要是用來將資料做區分,判斷資料是屬於哪一個類別。從原有的已知類別的資料集進...
學習深度學習,Nvidia 的 GPU和CUDA