Day16:Spark執行在Mesos平台上(一)

2017 iT 邦幫忙鐵人賽

DAY 16

Cloud

用30天來建構和操作Apache Mesos系列第 16 篇

2017鐵人賽

yangj26952

2016-12-16 07:29:01

2249 瀏覽

分享至

前面幾天都是在介紹Mesos的資源分配的部份，今天要來介紹使用Apache Spark執行在Mesos的平台上。

Apache Spark是什麼？

Apache Spark主要可以用在關於Big Data上的處理資料、運算資料、分析資料…等等的功能，它的優點是在In Memory的存放資料，而且在每個階段可以有效的做資料共用，如果對Apache Spark有興趣可以到它們的官網查看相關的文件資料。

Apache Spark可以在哪些平台上執行？

Apache Spark可以執行在很多的平台上如：在本機執行、Standalone、Yarn、Mesos…等等所以可以在很多的平台上執行，我們今天主要是使用Mesos的平台來執行Spark分散運算。

安裝前準備：

1、啟動Mesos Master，可以參考Day3

2、啟動Mesos Slave，可以參考Day3

3、每台的Mesos Slave都需要下載Apache Spark的執行程式

下載指令如下：

# wget http://d3kbcqa49mib13.cloudfront.net/spark-2.0.1-bin-hadoop2.7.tgz -P /opt

下載完之後要把壓縮檔的程式解壓縮，指令如下：

# cd /opt && tar zxvf /opt/spark-2.0.1-bin-hadoop2.7.tgz

執行Apache Spark程式：

在其中一台mesos slave上執行以下的指令，如下：

[root@mesos-slave1 ~]# cd /opt/spark-2.0.1-bin-hadoop2.7/bin
[root@mesos-slave1 bin]# ./spark-submit --class org.apache.spark.examples.SparkPi --master mesos://192.168.182.132:5050 ../examples/jars/spark-examples_2.11-2.0.1.jar 20000

spark-submit後面的class是spark提供執行pi的example，然後需要指定mesos master的IP位址加上PORT，20000是spark pi要求需要傳入的參數數字遇大執行遇久

執行的結果如下：

之後在執行的ternimal上可以看到計算結果：

以上是使用在Mesos平台上執行Spark的方式之一，明天還會再介紹其它的執行方式，以及這兩種方法之間的差異。

參考資料：

Apache Spark：http://spark.apache.org/docs/latest/running-on-mesos.html

Day15:Mesos資源設定Quota

Day17:Spark執行在Mesos平台上(二)

系列文

用30天來建構和操作Apache Mesos 共 30 篇

RSS系列文訂閱系列文

31 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22209 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

用30天來建構和操作Apache Mesos系列 第 16 篇