簡單了解Impala的概念後,就開始操作Impala的查詢給各位看, 同樣我先列出今天要操作的內容,晚點會再補上。 因為Hive已經有相關資訊了,所以我就不用再...
昨天提到NameNode還有講解裡面存放的檔案代表什麼意思,接著來補上DataNode的部分,如同前面所提Hadoop是master/slave架構,datan...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
總之,原本打算要寫的動物園之路,這條路線好像跟當初規劃的不太一樣,哈。 因為今天有去Hadoop in Taiwan 2013,所以就來分享一下這次去參加的心得...
這個標題好像有點奇怪,我主要是要表達Hadoop為什麼可以彈性擴充..還有介紹一下Hadoop的分散式架構.. Hadoop是一個可以進行大量分散運算的架構,...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
YARN的架構已經在昨日介紹過,基本上原本的Mapreduce的Job可以不用更改,就可以使用。 CM也有提供查看YARN節點狀態的畫面: 佈署與設定 佈署與...
昨天因為電影看太晚,所以沒有完全補上, 我先發今天的文章,再補上昨天的部分。 我先拿前面的mapreduce做同樣的例子,來計算每種花色的數量。 話不多說,直接...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
Pig比較不常用,我打算之後再慢慢補充前面兩天關於Pig的文章, Hive是我比較熟悉的工具,它的初衷是讓不熟悉Java或是MapReduce與Pig的使用者,...
昨天知道HBase的基本原理後,今天會帶個實作, 同樣也是利用虛擬機的方式來呈現。 主要會做資料的連續輸入來看HBase的儲存改變, <等會有急事,回家待...
剛看完賈伯斯首映,還蠻不錯了。 突然多一些熱血,但是時間快不夠了。 今天來講PIG好了。 帥氣的小豬哈 Pig是一個比較抽象的語言,可以用較高階的語法,撰寫m...
第七屆台灣 Hadoop 社群年會 HadoopCon 2015 將於 9/19(六) 假中央研究院人文社會科學館舉辦 2015 年延續「即時、安全、易用」三個...
誠摯邀請您加入NetPro Family~~本公司專精於 ETL, BI 領域的應用技術,我們自行開發 Trinity ETL 產品,深獲客戶肯定 福利制度一、...
歡迎來到第 26 天,今天要分享一個 Hadoop 中很重要的一個概念 - MapReduce。 接下來的分散式運算篇章中主要會是以學習筆記的形式呈現,如果是以...
終於講到我的 Home turf(主場、地盤)!(什麼叫做主場?就是沒 Google search 的前置作業需求) 2015 年我踏入大數據領域,在此之前我只...
「資料庫」不等於「資料庫系統」 中文的「資料庫」一詞在日常使用上,涵蓋電腦科學的 “database”(資料庫系統), 以及泛學科的 “Lists of dat...
台灣俗語說「吃果子拜樹頭,吃米飯拜田頭」,竟然要學習、使用 Hadoop,那就要先了解 Hadoop 的歷史與發源。 Hadoop 怎麼來的 Hadoop 的原...
Amazon Elastic MapReduce(EMR)是可以在EC2 instance 或 Amazon EKS cluster上執行Hadoop運算的託管...
本篇還是會再提 Hadoop,以對照 MPP 的特點。Massive Parallel Processing(MPP) 實際上是一種架構。理論上依據應用場景,M...
接續介紹昨天建立的EMR叢集: 建立的叢集可以在左方工具欄的叢集分頁找到步驟的狀態可以到「步驟」分頁查看,可以看到叢集會分兩步驟:先建立好Hadoop後再安裝S...
歡迎來到第 28 天,昨天提到 MapReduce 的觀念,今天要提到另一個 Hadoop 中的重點 HDFS(Hadoop Distributed File...
參賽動機 還記得本人高中的時候大數據這個詞很夯,那個時候根本不清楚大數據是什麼,只覺得把一大堆數據蒐集起來就叫做大數據吧,具體能拿來幹嘛其實也不太清楚;隨著A...