从hadoop一路配置到spark

安装

jdk-8u131-linux-x64.gz

scala-2.11.8.tgz

hadoop-2.7.3.tar.gz

spark-2.1.1-bin-hadoop2.7.tgz

vim /etc/profile

export ZOOKEEPER_HOME=/opt/zookeeper-3.4.8

export PATH=$ZOOKEEPER_HOME/bin:$PATH

export JAVA_HOME=/opt/jdk1.8.0_131

export CLASSPATH=$JAVA_HOME/lib

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=$ZOOKEEPER_HOME/lib:$CLASSPATH

export JSTORM_HOME=/opt/jstorm-2.2.1

export PATH=$JSTORM_HOME/bin:$PATH

export SCALA_HOME=/opt/scala-2.11.8

export PATH=$SCALA_HOME/bin:$PATH

export HADOOP_HOME=/opt/hadoop-2.7.3

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export SPARK_HOME=/opt/spark-2.1.1-bin-hadoop2.7

export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

ssh免密码登陆

ssh-keygen -t rsa

cd /root/.ssh

cat id_rsa.pub >> authorized_keys 三台机器的id_rsa.pub合并

vim /etc/hosts

192.168.56.101 j001

192.168.56.102 j002

192.168.56.103 j003

hadoop配置

mkdir /opt/data

mkdir /opt/data/hadoop

mkdir /opt/data/hadoop/tmp

cd /opt/hadoop-2.7.3/etc/hadoop

vim hadoop-env.sh

export JAVA_HOME=/opt/jdk1.8.0_131

export HADOOP_PREFIX=/opt/hadoop-2.7.3

vim yarn-env.sh

export JAVA_HOME=/opt/jdk1.8.0_131

vim core-site.xml

<name>hadoop.tmp.dir</name>

<value>/opt/data/hadoop/tmp</value>

</property>

<name>fs.default.name</name>

<value>hdfs://主节点IP:9000(未被占用的端口号都可以)</value>

</property>

</configuration>

vim hdfs-site.xml

<name>dfs.replication</name>

<value> hdfs的副本数</value>

</property>

<value>dfs名称(/opt/data/hadoop/tmp/dfs/name)</value>

</property>

<value>dfs数据路径(/opt/data/hadoop/tmp/dfs/data)</value>

</property>

</configuration>

cp mapred-site.xml.template mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

</configuration>

vim yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name>

</property>

---新增

在mapred-site.xml配置文件中添加：

<name>mapreduce.jobhistory.address</name>

</property>

在namenode上执行命令：mr-jobhistory-daemon.sh start historyserver

这样在，namenode上会启动JobHistoryServer服务，可以在historyserver的日志中查看运行情况

vim slaves

j001

j002

j003

启动

hdfs namenode -format

cd sbin

start-dfs.sh

start-yarn.sh

http://192.168.56.101:50070/

停止Yarn及HDFS

#stop-yarn.sh

#stop-dfs.sh

SPARK配置

cd /opt/spark-2.1.1-bin-hadoop2.7/conf

mv spark-env.sh.template spark-env.sh

vim spark-env.sh

export JAVA_HOME=/opt/jdk1.8.0_131

export SCALA_HOME=/opt/scala-2.11.8

export SPARK_MASTER_HOST=192.168.56.101

export SPARK_MASTER_IP=192.168.56.101

export SPARK_LOCAL_IP=192.168.56.103

export SPARK_MASTER_PORT=7077

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_WORKER_PORT=7078

export SPARK_WORKER_WEBUI_PORT=8081

export SPARK_WORKER_MEMORY=400m

export HADOOP_HOME=/opt/hadoop-2.7.3

export HADOOP_CONF_DIR=/opt/hadoop-2.7.3/etc/hadoop

export SPARK_HOME=/opt/spark-2.1.1-bin-hadoop2.7

mv slaves.template slaves

j002

j003

start-master.sh

等http://192.168.56.101 :8080能访问了再执行start-slaves.sh

#stop-master.sh

#stop-slaves.sh

http://www.jianshu.com/p/e2665ddd5d31

http://blog.csdn.net/tangzwgo/article/details/25893989

hdfs dfs -mkdir /input

hdfs dfs -put aa.xtx /input

hadoop jar

从hadoop一路配置到spark的更多相关文章

ubuntu下hadoop环境配置
软件环境: 虚拟机:VMware Workstation 10 操作系统:ubuntu-12.04-desktop-amd64 JAVA版本:jdk-7u55-linux-x64 Hadoop版本:h ...
Hadoop3集群搭建之——安装hadoop，配置环境
接上篇:Hadoop3集群搭建之——虚拟机安装下篇:Hadoop3集群搭建之——配置ntp服务 Hadoop3集群搭建之——hive安装 Hadoop3集群搭建之——hbase安装及简单操作上篇已 ...
CentOS 7 Hadoop安装配置
前言:我使用了两台计算机进行集群的配置,如果是单机的话可能会出现部分问题.首先设置两台计算机的主机名 root 权限打开/etc/host文件再设置hostname,root权限打开/etc/hos ...
hadoop(四):配置参数
hadoop参数配置,主要是配置 core-site.xml,hdfs-site.xml,mapred-site.xml 三个配置文件,core-site.xml是全局配置,hdfs-site.xml ...
hadoop mapred-queue-acls 配置(转)
hadoop作业提交时可以指定相应的队列,例如:-Dmapred.job.queue.name=queue2通过对mapred-queue-acls.xml和mapred-site.xml配置可以对不 ...
hadoop安装配置——伪分布模式
1. 安装这里以安装hadoop-0.20.2为例先安装java,参考这个去着下载hadoop 解压 2. 配置修改环境变量 vim ~/.bashrc export HADOOP_HOME= ...
Hadoop平台配置总结
hadoop的配置,个人感觉是非常容易出问题.一个原因是要配置的地方多,还有个原因就是集群配置要在几台机器上都配置正确,才能保证配置好hadoop,跑起任务. 经过昨晚加今天上午的折腾,总算成功配好了 ...
有关hadoop分布式配置详解
linux配置ssh无密码登录配置ssh无密码登录,先要安装openssh,如下: yum install openssh-clients 准备两台linux服务器或虚拟机,设置两台linux的ho ...
CentOS Hadoop安装配置详细
总体思路,准备主从服务器,配置主服务器可以无密码SSH登录从服务器,解压安装JDK,解压安装Hadoop,配置hdfs.mapreduce等主从关系. 1.环境,3台CentOS7,64位,Hadoo ...

随机推荐

PhoenixFD插件流体模拟——UI布局【Input】详解
Liquid Input 流体输入本文主要讲解Input折叠栏中的内容.原文地址:https://docs.chaosgroup.com/display/PHX3MAX/Liquid+Input 主 ...
Python设计模式 - UML - 时序图(Sequence Diagram)
简介时序图表示参与者与对象之间.对象与对象之间的动态交互过程及时序关系. 时序图详细而直观地展示了对象随时间变化的状态.调用关系和消息时序,时序图中的主要元素有:参与者(Actor), 对象(Obj ...
Docker容器镜像瘦身的三个小窍门(转)
[转自:http://dockone.io/article/8174] 在构建Docker容器时,我们应尽可能减小镜像的大小.使用共享层的镜像尺寸越小,其传输和部署速度越快. 不过在每个RUN语句都会 ...
搭建zookeeper和Kafka集群
搭建zookeeper和Kafka集群: 本实验拥有3个节点,均为CentOS 7系统,分别对应IP为10.211.55.11.10.211.55.13.10.211.55.14,且均有相同用户名 ( ...
POJ-1860.CurrencyExchange(Spfa判断负环模版题)
本题思路:每完成一次交换之后交换余额多于原钱数则存在正环,输出YES即可. 参考代码: #include <cstdio> #include <cstring> #includ ...
玩转postman（一）-----基础
postman的GUI界面以及各个组件介绍主界面如下打开postman的GUI界面以及各个元素组件介绍分为下三部分: 1.Head navigation bar (头部导航栏):此部分有以下选项 ...
自学elastic search
工作也有一段时间了,虽然来这个公司之后学会了几门不同的语言,但想拨尖还是任重道远. 想往高级程序员甚至是架构师方向发展.他仍然是我的学习对象.我现在做着的,无非是他玩剩下的罢了. luncene之前有 ...
探究osg中的程序设计模式【目录】
前序探究osg中的程序设计模式---开篇探究osg中的程序设计模式---创造性模式探究osg中的程序设计模式---创造型模式---Factory(工厂)模式探究osg中的程序设计模式---创造 ...
QTcpSocket 相关知识总结
1. 连接服务器 m_tcpSocket->connectToHost("127.0.0.1", 9877); connected = m_tcpSocket->wa ...
sort 对多列进行排序
sort -t '\t' -k 3,3 -k 2,2 文件名 # 先对第三列进行排序,然后再对第二列进行排序

从hadoop一路配置到spark

从hadoop一路配置到spark的更多相关文章

随机推荐

热门专题