接下來會帶到Hive的應用實做,如果想要把Script紀錄起來, 就可以用Hue Beeswax(Hive UI),還可以用介面寫UDF,蠻方便了。 這次也是...
Pig比較不常用,我打算之後再慢慢補充前面兩天關於Pig的文章, Hive是我比較熟悉的工具,它的初衷是讓不熟悉Java或是MapReduce與Pig的使用者,...
昨天因為電影看太晚,所以沒有完全補上, 我先發今天的文章,再補上昨天的部分。 我先拿前面的mapreduce做同樣的例子,來計算每種花色的數量。 話不多說,直接...
剛看完賈伯斯首映,還蠻不錯了。 突然多一些熱血,但是時間快不夠了。 今天來講PIG好了。 帥氣的小豬哈 Pig是一個比較抽象的語言,可以用較高階的語法,撰寫m...
NameNode掛掉之後,基本上整個Hadoop就往生了... 如果NameNode資料沒遺失的話,那重啟應該就沒問題,但是... 當edits與fsimage...
昨天提到NameNode還有講解裡面存放的檔案代表什麼意思,接著來補上DataNode的部分,如同前面所提Hadoop是master/slave架構,datan...
昨天提到MapReduce可以讀取HDFS上的檔案,然後根據檔案的Block數量,產生對應的Map數,接著再透過Reduce輸出到HDFS上。 前面可以知道HD...
前幾天已經有跑一次MapReduce的範例了,現在就來簡單說一下MapReduce的原理。 Google一下其實很多資料,但是鐵人賽是對自我的實現! 還是要寫M...
昨天上半場的部分,我整理完筆記會再補完,下半場跟去年一樣, 分為開發者、營運者與應用案例。 圖片來源:http://www.hadoopintaiwan.com...
總之,原本打算要寫的動物園之路,這條路線好像跟當初規劃的不太一樣,哈。 因為今天有去Hadoop in Taiwan 2013,所以就來分享一下這次去參加的心得...
昨天寫的MapReduce並沒有放在Hadoop上跑,只有在Eclipse裡面跑,所以今天會把jar檔丟到Hadoop裡面,來看看執行的效果。 我也把檔案在累加...
接下來就要來帶各位來寫個MapReduce,網路上很多資源可以參考, 我主要是使用Cloudera的虛擬機來做示範,虛擬機裡面已經有內建Eclipse讓使用者進...
昨天有提到CM可以直接幫管理者安裝Hadoop服務在新的主機上,今天就用虛擬機來示範一下摟。 我先在自己電腦裡面的VMware Player 安裝新的ubunt...
這其實是昨天要分享的東西,但是網路怪怪了,我的文章就消失不見了... 今天來分享一下使用Cloudera Manager的心得。 Cloudera Manage...
因為最近PTT的SoftJob版,有關Hadoop的討論引起了版友之間的激烈討論, 一開始的那篇引起爭論的文章,我認為他講的沒有錯, http://www.ch...
這個標題好像有點奇怪,我主要是要表達Hadoop為什麼可以彈性擴充..還有介紹一下Hadoop的分散式架構.. Hadoop是一個可以進行大量分散運算的架構,...
如昨天提到了,Cloudera的Hadoop證照目前有以下這幾張: Cloudera Certified Professional (CCP): Data Sc...
雖然一直講到要安裝,不過等會就要去烤肉了, 男子漢的約定,可不能因為一個小白兔颱風就此打退堂鼓!! 所以先介紹一些有關Hadoop的證照~不過是Cloudera...
前面有提到,Hadoop如果可以的話,最好安裝在實體機上進行測試。如果預算有限,只能安裝到自己電腦上的話,就要安裝虛擬機,來進行佈署。從Apache Hadoo...
不管決定哪種大象,要把大象牽回家之前,要把場地準備好,我自己本身是在筆電架設虛擬機, 當然最好還是可以拿實體機來進行架設~ 盡管Cloudera有將整個Hado...
起初我對養這隻大象原因並不曉得,只知道很多人對這頭大象很有興趣,但是起初真正有養大象養得健康又漂亮的沒有很多,接著陸陸續續越來愈多人養了這頭大象,他們的原因都不...
在成功嶺唱完替代役夢想起飛後,下山來踏入的第一份工作,就是要和這隻黃色大象做朋友。這隻大象叫做Hadoop,照顧這隻長得有點猥褻的大象日子過得很快,也認識這隻大...
分散式系統(Hadoop) 微程式資訊股份有限公司:研發部協理 分享對象:公司一級主管 http://rd-program.blogspot.com/2011/...