Spark1.0.0 分布式环境搭建
软件版本号例如以下:
Hostname |
IP |
Hadoop版本号 |
Hadoop |
功能 |
系统 |
master |
192.168.119.128 |
1.1.2 |
namenode |
jdk1.6+hadoop+scala2.9.3+spark1.0.0 |
centos4.9 |
slave1 |
192.168.119.129 |
1.1.2 |
datanode |
jdk1.6+hadoop+scala2.9.3+spark1.0.0 |
centos4.9 |
slave2 |
192.168.119.130 |
1.1.2 |
datanode |
jdk1.6+hadoop+scala2.9.3+spark1.0.0 |
centos4.9 |
1 首先搭建hadoop环境,这里不具体说,网上非常多。
2 然后安装scala环境,非常easy和配置jdk类似
2.1 下载scala 安装包 2.9.3
http://www.scala-lang.org/download/2.9.3.html#Software_Requirements
2.2 下载的 scala-2.9.3.tgz ftp 到master机
文件夹为 /home/bigdata/
2.3 进入文件夹 /home/bigdata/
tar -zxf scala-2.9.3.tgz
mv scala-2.9.3 scala
/home/bigdata/scala (配置文件夹)
2.4 配置环境变量(分别到3台机器配置)
vi /etc/profile
export SCALA_HOME=/home/bigdata/scala
export PATH=$PATH:$SCALA_HOME/bin
source /etc/profile
2.5 检測是否配置成功
scala -version
Scala code runner version 2.9.3 -- Copyright 2002-2011, LAMP/EPFL
表示成功安装
2.6 远程拷贝到其他机:(结构文件夹和master一致)
scp -r /home/bigdata/scala root@192.168.119.129:/home/bigdata/
scp -r /home/bigdata/scala root@192.168.119.130:/home/bigdata/
3 配置spark
3. 1 下载spark 1.0.0 http://spark.apache.org/downloads.html
3.2 复制包到 spark-1.0.0-bin-hadoop1.tgz 中
文件夹为:/home/bigdata/
3.3 进入文件夹 /home/bigdata/
tar -zxf spark-1.0.0-bin-hadoop1.tgz
mv spark-1.0.0-bin-hadoop1 spark-hadoop1
得到 /home/bigdata/spark-hadoop1 (配置路径)
3.4 配置用户环境变量 (分别配置3台机器)
vi ~/.bash_profile
export SPARK_HOME=/home/bigdata/spark-hadoop1
export PATH=$PATH:$SPARK_HOME/bin
source ~/.bash_profile
3.5 在conf 中设置scala
cd /home/bigdata/spark-hadoop1/conf
cp spark-env.sh.template spark-env.sh
vi spark-env.sh
加入
export JAVA_HOME=/home/bigdata/jdk(Jdk安装路径)
export SCALA_HOME=/home/bigdata/scala(scala 安装路径)
3.6 拷贝到其他机器
scp -r /home/bigdata/spark-hadoop1 root@slave1:/home/bigdata/
scp -r /home/bigdata/spark-hadoop1 root@slave2:/home/bigdata/
4 启动hadoop集群
5 启动spark 集群
在master 机进入文件夹 /home/bigdata/spark-hadoop1/sbin
sh start-all.sh
jps
5704 DataNode
6021 TaskTracker
5587 NameNode
5898 JobTracker
5810 SecondaryNameNode
6374 Worker
6457 Jps
6239 Master
6 启动web訪问页面 http://master:8080/
进入 /home/bigdatat//spark-hadoop1/bin/ spark-shell
參考:点击打开链接
Spark1.0.0 分布式环境搭建的更多相关文章
- Hadoop2.7.3+Spark2.1.0 完全分布式环境 搭建全过程
一.修改hosts文件 在主节点,就是第一台主机的命令行下; vim /etc/hosts 我的是三台云主机: 在原文件的基础上加上; ip1 master worker0 namenode ip2 ...
- Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
- hive-2.2.0 伪分布式环境搭建
一,实验环境: 1, ubuntu server 16.04 2, jdk,1.8 3, hadoop 2.7.4 伪分布式环境或者集群模式 4, apache-hive-2.2.0-bin.tar. ...
- Spark2.4.0伪分布式环境搭建
一.搭建环境的前提条件 环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161. spark-2.4.0-bin-hadoop2.6.这里的环境不一定需要和我一样,基本版 ...
- 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
- Hadoop学习笔记(3)——分布式环境搭建
Hadoop学习笔记(3) ——分布式环境搭建 前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下. 在这里, ...
- Hadoop-04-HBase全然分布式环境搭建
Hbase分布式具体安装步骤 Hadoop全然分布式环境已经搭建完毕(參见01_Hadoop全然分布式环境搭建). 注意:Hbase和Hadoop的版本号必须相应! 不然会出现各种问题! 这里选用的是 ...
- Hadoop-2.4.1完全分布式环境搭建
Hadoop-2.4.1完全分布式环境搭建 Hadoop-2.4.1完全分布式环境搭建 一.配置步骤如下: 主机环境搭建,这里是使用了5台虚拟机,在ubuntu 13系统上进行搭建hadoop ...
- 【转】Hadoop HDFS分布式环境搭建
原文地址 http://blog.sina.com.cn/s/blog_7060fb5a0101cson.html Hadoop HDFS分布式环境搭建 最近选择给大家介绍Hadoop HDFS系统 ...
- 【Hadoop】伪分布式环境搭建、验证
Hadoop伪分布式环境搭建: 自动部署脚本: #!/bin/bash set -eux export APP_PATH=/opt/applications export APP_NAME=Ares ...
随机推荐
- 为iPhone 6设计自适应布局
Apple从iOS 6加入了Auto Layout后开始就比较委婉的开始鼓励.建议开发者使用自适应布局,但是到目前为止,我感觉大多数开发者一直在回避这个问题,不管是不是由于历史原因造成的,至少他们在心 ...
- fread(),fwrite() 读/写流
C 库函数 - fread() 描述 C 库函数 size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream) 从给定流 strea ...
- Hacker(16)----防范端口扫描与嗅探
端口扫描与嗅探都是黑客常用的招数,其目的是定位目标计算机和窃取隐私信息.为确保自己计算机的安全,用户需要掌握防范嗅探与端口扫描的常见措施,保障个人隐私信息安全. 一.掌握防范端口扫描的常用措施 防范端 ...
- .NET SQL Server连接字符串句法
.NET SQL Server连接字符串句法 数据库的连接性已经发展成为应用程序开发的一个标准方面.数据库连接字符串现在已经成为每个项目的标准必备条件.我发现自己为了找到所需要的句法,经常要从另外一个 ...
- 0130——UIScrollView
1.contentSize幕布实际大小决定滚动的方向,如果小于图片本身不滚动,默认也是不滚动 view.contentSize = CGSizeMake(1280, 200); 而frame只是用来显 ...
- HDU 5195 - DZY Loves Topological Sorting
题意: 删去K条边,使拓扑排序后序列字典序最大 分析: 因为我们要求最后的拓扑序列字典序最大,所以一定要贪心地将标号越大的点越早入队.我们定义点i的入度为di. 假设当前还能删去k条边,那么我们一定会 ...
- win32系统信息获取
#include <Windows.h> #include "resource.h" #include <strsafe.h> PTSTR BigNumTo ...
- VC++下使用SQLite数据库
老师最近给的上机题目有点变态,特别是写到最后,是需要写学生管理系统.如果C语言结合文件来操作的话,估计会比较麻烦(对文件里字符串的增删改查我都没有什么好点的算法).那就用数据库吧,我很自然的想到. 前 ...
- 解决Sublime-Text-3在ubuntu下中文输入的问题
在ubuntu下使用ST这神器已经一段日子了,但是一直有个纠结的问题,就是中文输入非常坑爹,曾经一段时间,使用inputHelper这个插件来解决, 但是……每次都要按个快捷键,弹出一个小小小框来输入 ...
- [Mugeda HTML5技术教程之18]如何在Android应用中使用Mugeda动画内容
1.简介 本文主要介绍如何在Android应用程序中使用Mugeda动画.Mgeda动画是标准HTML5格式的动画,在Android应用程序中可以使用WebView来加载Mugeda动画.动画内容本身 ...