iT邦幫忙

鐵人檔案

2013 iT 邦幫忙鐵人賽
回列表

動物園之路 系列

接觸黃色大象(Hadoop)也有一陣子了,圍繞著這隻大象總有些有趣的事情,分享學習Hadoop相關的點點滴滴。

鐵人鍊成 | 共 27 篇文章 | 14 人訂閱 訂閱系列文 RSS系列文
DAY 11

動物園之路 -11- 跟大象說Hello~MapReduce(1)

接下來就要來帶各位來寫個MapReduce,網路上很多資源可以參考, 我主要是使用Cloudera的虛擬機來做示範,虛擬機裡面已經有內建Eclipse讓使用者進...

2013-09-26 ‧ 由 fantasylight 分享
DAY 12

動物園之路 -12- 跟大象說Hello~MapReduce(2)

昨天寫的MapReduce並沒有放在Hadoop上跑,只有在Eclipse裡面跑,所以今天會把jar檔丟到Hadoop裡面,來看看執行的效果。 我也把檔案在累加...

2013-09-27 ‧ 由 fantasylight 分享
DAY 16

動物園之路 -16- 大象的肚子好大!-HDFS

昨天提到MapReduce可以讀取HDFS上的檔案,然後根據檔案的Block數量,產生對應的Map數,接著再透過Reduce輸出到HDFS上。 前面可以知道HD...

2013-10-01 ‧ 由 fantasylight 分享
DAY 17

動物園之路 -17- 大象的肚子好大!-HDFS (續-Datanode)

昨天提到NameNode還有講解裡面存放的檔案代表什麼意思,接著來補上DataNode的部分,如同前面所提Hadoop是master/slave架構,datan...

2013-10-02 ‧ 由 fantasylight 分享
DAY 18

動物園之路 -18- 大象一定要活下去!

NameNode掛掉之後,基本上整個Hadoop就往生了... 如果NameNode資料沒遺失的話,那重啟應該就沒問題,但是... 當edits與fsimage...

2013-10-03 ‧ 由 fantasylight 分享
DAY 19

動物園之路 -19- 大象與豬的友誼(1)

剛看完賈伯斯首映,還蠻不錯了。 突然多一些熱血,但是時間快不夠了。 今天來講PIG好了。 帥氣的小豬哈 Pig是一個比較抽象的語言,可以用較高階的語法,撰寫m...

2013-10-04 ‧ 由 fantasylight 分享
DAY 20

動物園之路 -20- 大象與豬的友誼(2)

昨天因為電影看太晚,所以沒有完全補上, 我先發今天的文章,再補上昨天的部分。 我先拿前面的mapreduce做同樣的例子,來計算每種花色的數量。 話不多說,直接...

2013-10-05 ‧ 由 fantasylight 分享
DAY 21

動物園之路 -21- 大象吃蜂蜜

Pig比較不常用,我打算之後再慢慢補充前面兩天關於Pig的文章, Hive是我比較熟悉的工具,它的初衷是讓不熟悉Java或是MapReduce與Pig的使用者,...

2013-10-06 ‧ 由 fantasylight 分享
DAY 22

動物園之路 -22- 大象吃蜂蜜(續)

接下來會帶到Hive的應用實做,如果想要把Script紀錄起來, 就可以用Hue Beeswax(Hive UI),還可以用介面寫UDF,蠻方便了。 這次也是...

2013-10-07 ‧ 由 fantasylight 分享
DAY 23

動物園之路 -23- 大象的NOSQL-HBase

HBase基於Hadoop的一個欄導向資料庫(column-oriented),具有即時性與可分散的特性。 在CAP理論中,HBase選擇C與P,確保資料一致性...

2013-10-08 ‧ 由 fantasylight 分享