接觸黃色大象(Hadoop)也有一陣子了,圍繞著這隻大象總有些有趣的事情,分享學習Hadoop相關的點點滴滴。
接下來就要來帶各位來寫個MapReduce,網路上很多資源可以參考, 我主要是使用Cloudera的虛擬機來做示範,虛擬機裡面已經有內建Eclipse讓使用者進...
昨天寫的MapReduce並沒有放在Hadoop上跑,只有在Eclipse裡面跑,所以今天會把jar檔丟到Hadoop裡面,來看看執行的效果。 我也把檔案在累加...
昨天提到MapReduce可以讀取HDFS上的檔案,然後根據檔案的Block數量,產生對應的Map數,接著再透過Reduce輸出到HDFS上。 前面可以知道HD...
昨天提到NameNode還有講解裡面存放的檔案代表什麼意思,接著來補上DataNode的部分,如同前面所提Hadoop是master/slave架構,datan...
NameNode掛掉之後,基本上整個Hadoop就往生了... 如果NameNode資料沒遺失的話,那重啟應該就沒問題,但是... 當edits與fsimage...
剛看完賈伯斯首映,還蠻不錯了。 突然多一些熱血,但是時間快不夠了。 今天來講PIG好了。 帥氣的小豬哈 Pig是一個比較抽象的語言,可以用較高階的語法,撰寫m...
昨天因為電影看太晚,所以沒有完全補上, 我先發今天的文章,再補上昨天的部分。 我先拿前面的mapreduce做同樣的例子,來計算每種花色的數量。 話不多說,直接...
Pig比較不常用,我打算之後再慢慢補充前面兩天關於Pig的文章, Hive是我比較熟悉的工具,它的初衷是讓不熟悉Java或是MapReduce與Pig的使用者,...
接下來會帶到Hive的應用實做,如果想要把Script紀錄起來, 就可以用Hue Beeswax(Hive UI),還可以用介面寫UDF,蠻方便了。 這次也是...
HBase基於Hadoop的一個欄導向資料庫(column-oriented),具有即時性與可分散的特性。 在CAP理論中,HBase選擇C與P,確保資料一致性...