資料來源 跨資料分析能夠結合不同的知識,進而找出資料間無法明顯發覺的關連性。跨資料分析牽涉到不同領域的背景,也需要處理、串聯不同來源的資料集,是一個具有挑戰的工...
黑色好看版 - 傳送門 不知不覺~漫長的鐵人賽就進入了尾聲,當初會參加鐵人賽也只是因為,沒參加過 ~ 來試試看,而且也剛好我今年的時間比較多點兒,話說回來,為...
昨天我們看了SparkingStreamingContext的起手式與一個stateless的use case。基本上,我認為stateless不用處理關注其他...
黑色好看版 - 傳送門 上一篇文章我們詳細的說明完分片的機制後,接下來我們就要來詳細的說明片鍵的選擇,片鍵的選擇關係到你的分片執行速度與效能,並且一但建立後,...
一直很想把Patten matching、Case Class、Extrator、Sealed的相關概念寫一下,就再來個番外吧。今天沒有Spark,但是有很重要...
資料科學與 JavaScript 前面幾天介紹的 Python 及 R 語言是資料科學家的主要工具,用來做資料的處理、分析。我認為除了那兩個語言之外,JavaS...
人家一般宅宅玩美少女養成,我們宅宅2.0當然要煉不一樣的養成道路,挑戰真正的玩意兒能去接送你心中的女神(如果她願意上車...我是說真的改裝車嘿) 像這樣,今年的...
Bayesian statistics有什麼應用呢?就是Naive Bayes classifier拉~~~ 其前面那個naive我一直不知道要怎麼翻他,有的翻...
後記 這一個月來,在鐵人賽這個舞台上一天一篇技術文。我嘗試總結了自己個對於基料科學這個領域的角度。從最開始的理論談起,談了一些實作上會用到的東西。從最務實的角度...
黑色好看版 - 傳送門 咱們來細數一下,我們在前面的幾篇學了那些東西~ mongodb的新增、刪除、更新、搜尋。 mongodb的索引運用。 mong...