參賽動機 還記得本人高中的時候大數據這個詞很夯,那個時候根本不清楚大數據是什麼,只覺得把一大堆數據蒐集起來就叫做大數據吧,具體能拿來幹嘛其實也不太清楚;隨著A...
本篇還是會再提 Hadoop,以對照 MPP 的特點。Massive Parallel Processing(MPP) 實際上是一種架構。理論上依據應用場景,M...
終於講到我的 Home turf(主場、地盤)!(什麼叫做主場?就是沒 Google search 的前置作業需求) 2015 年我踏入大數據領域,在此之前我只...
「資料庫」不等於「資料庫系統」 中文的「資料庫」一詞在日常使用上,涵蓋電腦科學的 “database”(資料庫系統), 以及泛學科的 “Lists of dat...
接續介紹昨天建立的EMR叢集: 建立的叢集可以在左方工具欄的叢集分頁找到步驟的狀態可以到「步驟」分頁查看,可以看到叢集會分兩步驟:先建立好Hadoop後再安裝S...
Amazon Elastic MapReduce(EMR)是可以在EC2 instance 或 Amazon EKS cluster上執行Hadoop運算的託管...
歡迎來到第 28 天,昨天提到 MapReduce 的觀念,今天要提到另一個 Hadoop 中的重點 HDFS(Hadoop Distributed File...
歡迎來到第 26 天,今天要分享一個 Hadoop 中很重要的一個概念 - MapReduce。 接下來的分散式運算篇章中主要會是以學習筆記的形式呈現,如果是以...
台灣俗語說「吃果子拜樹頭,吃米飯拜田頭」,竟然要學習、使用 Hadoop,那就要先了解 Hadoop 的歷史與發源。 Hadoop 怎麼來的 Hadoop 的原...
Hive是基於Hadoop的資料倉庫工具,可對存儲在HDFS上的檔中的資料集進行資料整理、特殊查詢和分析處理,提供了類似於SQL語言的查詢語言–HiveQL,可...
我們正在尋找對電商充滿熱情的你加入Newegg大家庭NEW EGG Excellent 網站流量:全球每月平均2,200萬獨立訪客 330萬的產品評價,3,3...
誠摯邀請您加入NetPro Family~~本公司專精於 ETL, BI 領域的應用技術,我們自行開發 Trinity ETL 產品,深獲客戶肯定 福利制度一、...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
如果你熱愛學習,希望持續提升自己的技術能力如果你喜歡挑戰,建構穩定系統,讓百萬玩家同時在線如果你追求成就感,想在任何地點,看到玩家登入你負責的遊戲你覺對不能錯過...
第七屆台灣 Hadoop 社群年會 HadoopCon 2015 將於 9/19(六) 假中央研究院人文社會科學館舉辦 2015 年延續「即時、安全、易用」三個...
( 更新編輯中:2014-10-23 Am 07:05 ) 當台灣很多有識之士仍在疾聲呼籲台灣廠商的大數據商機思維,不要停在上個世紀的製造業模式,要走出習慣於代...
報名網址:http://www.accupass.com/go/hadoopcon2014 第一波早鳥票將於 8/23(六) 23:59 截止。將視報名情況決定...
終於到最後一天了,昨天的Spark還沒打完,一樣按照之前的方式,一天寫概念,另一天帶實做。 今天的實作可能沒辦法帶完,不過我還是會盡力。 之後會把之前缺的部分補...
倒數兩天了,回顧第一天的時候,發現跳過zookeeper沒講到。 不過之前就很想來玩 Apache Spark,而且這次為了鐵人賽的文章, 真的有把一些不熟的地...
YARN的架構已經在昨日介紹過,基本上原本的Mapreduce的Job可以不用更改,就可以使用。 CM也有提供查看YARN節點狀態的畫面: 佈署與設定 佈署與...
MapReduce雖然可以協助使用者處理大量的資料, 但是這個架構仍然存在一些問題,像是Job Tracker如果出錯的話,整個Job都會失敗。當發送的Job過...
簡單了解Impala的概念後,就開始操作Impala的查詢給各位看, 同樣我先列出今天要操作的內容,晚點會再補上。 因為Hive已經有相關資訊了,所以我就不用再...
Impala是Cloudera所推出基於HDFS與HBase的Realtime(?) Query產品,有點像是Hive的感覺,但是速度快很多,目前可使用的查詢語...
昨天知道HBase的基本原理後,今天會帶個實作, 同樣也是利用虛擬機的方式來呈現。 主要會做資料的連續輸入來看HBase的儲存改變, <等會有急事,回家待...
HBase基於Hadoop的一個欄導向資料庫(column-oriented),具有即時性與可分散的特性。 在CAP理論中,HBase選擇C與P,確保資料一致性...