先來張Spark 2.0賀圖,這樣也算直上Spark-shell了......XD 開發環境簡述 Java8 Hadoop2.7.2(為了HDFS) Spar...
不知道大家有沒有一個印象,有一些生活場景你就是特別會把它牢牢記住. 那對於我而言,今年人機大戰李世石對 AlphaGo 下的那個神之一手的場景絕對會讓我一輩子記...
幾經掙扎,真覺得比賽為什要辦在年底呢,真的是水深火熱啊!原本是打算寫Asp.Net MVC,但怕寫到一半就跑不動了,偏偏肚子沒什麼墨水,東擠西擠倒是有一些油水啦...
其實這次比賽是推坑來的XD 被某財神建議可以在發一系列文章參加比賽,我就在想到底我要寫些什麼。Big data不過一兩年的事情,卻包含了很多的模型、後端架構、分...
今年我因緣際會,得到一個在start up 中建構RTB(Real Time Bidding)的廣告即時競標系統的職位。憑藉著過去的經驗,我一直很期待能依照自己...
資料前處理 資料是資料科學中的基石,沒有好的資料,就難以產生好的資料價值。在資料分析中有一句諺語:「Garbage In Garbage Out」,意思就是髒的...
黑色好看版 - 傳送門 前兩篇說明完mongodb所提供的第一種聚合工作aggregate framework,本篇文章將要說明mongodb所提供的第二種聚...
並不是所有的資料都能這麼方便地以表格式資料(Tabular data),EXCEL 試算表或者 JSON 載入工作環境,有時候我們的資料散落在網路不同的角落裡,...
尼奧棒球專家是國內遊戲公司寫的棒球記錄軟體, 它的手冊,可以看成是系統分析文件,非常詳實。3年多沒更新了。而它的記錄檔是binary格式,要再利用 比較麻煩。小...
什麼是研究 Big Data 第一步要做的事?Wiki 說:「大數據必須藉由計算機對資料進行統計、比對、解析方能得出客觀結果。」 所以我們得先要有資料,才有所謂...