安装包

Hadoop 3.1.3
Zookeeper 3.5.7
Hbase 2.2.2

所需工具链接：

链接：https://pan.baidu.com/s/1jcenv7SeGX1gjPT9RnBsIQ

提取码：rkca

伪分布式并无用处，只作为课堂测试环境使用，配置所做笔记。

配置

Hadoop

core-site.xml 填加配置项

<!-- 指定HDFS中NameNode的地址 -->

	<property>

		<name>fs.defaultFS</name>

    		<!-- 根据实际地址进行配置 -->

      		<value>hdfs://hadoop104:8020</value>

	</property>

	<!-- 指定Hadoop运行时产生文件的存储目录 -->

	<property>

		<name>hadoop.data.dir</name>

		<value>/opt/module/hadoop-3.1.3/data</value>

	</property>

	<!-- 修改访问web端的用户 -->

	<property>

		<name>hadoop.http.staticuser.user</name>

		<value>nevesettle</value>

	</property>

hdfs-site.xml 添加配置项

<!--指定存储的副本个数 -->

	<property>

		<name>dfs.replication</name>

		<value>1</value>

	</property>

	<!-- 指定namenode数据的存储目录  -->

	<property>

                <name>dfs.namenode.name.dir</name>

                <value>file://${hadoop.data.dir}/name</value>

        </property>

	<!-- 指定datanode数据的存储目录  -->

        <property>

                <name>dfs.datanode.data.dir</name>

                <value>file://${hadoop.data.dir}/data</value>

        </property>

	<!-- 指定secondarynode数据的存储目录  -->

        <property>

                <name>dfs.namenode.checkpoint.dir</name>

                <value>file://${hadoop.data.dir}/namesecondary</value>

        </property>

	<!-- 兼容配置-->

	<property>

                <name>dfs.client.datanode-restart.timeout</name>

                <value>30s</value>

        </property>

	<!--2nn web端访问地址-->

	<property>

      		<name>dfs.namenode.secondary.http-address</name>

      		<value>hadoop104:9868</value>

	</property>

	<!--nn web端访问地址-->

        <property>

                <name>dfs.namenode.http-address</name>

                <value>hadoop104:9870</value>

        </property>

yarn-site.xml 添加配置项

<!-- Reducer获取数据的方式 -->

	<property>

		<name>yarn.nodemanager.aux-services</name>

		<value>mapreduce_shuffle</value>

	</property>

	<!-- 指定YARN的ResourceManager的地址 -->

	<property>

		<name>yarn.resourcemanager.hostname</name>

		<value>hadoop104</value>

	</property>

	<!-- 环境变量的继承 -->

        <property>

                <name>yarn.nodemanager.env-whitelist</name>

                <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,PATH,LANG,TZ</value>

        </property>

	<!--开启日志聚集功能-->

	<property>

		<name>yarn.log-aggregation-enable</name>

		<value>true</value>

	</property>

	<!--查看日志的路径-->

	<property>

		<name>yarn.log.server.url</name>

		<value>http://hadoop104:19888/jobhistory/logs</value>

	</property>

	<!--日志存储的时间-->

	<property>

		<name>yarn.log-aggregation.retain-seconds</name>

		<value>604800</value>

	</property>

 	<!-- 找不到主类报错 -->

	<property>

        <name>yarn.application.classpath</name>

	<value>/opt/module/hadoop-3.1.3/etc/hadoop:/opt/module/hadoop-3.1.3/share/hadoop/common/lib/*:/opt/module/hadoop-3.1.3/share/hadoop/common/*:/opt/module/hadoop-3.1.3/share/hadoop/hdfs:/opt/module/hadoop-3.1.3/share/hadoop/hdfs/lib/*:/opt/module/hadoop-3.1.3/share/hadoop/hdfs/*:/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/lib/*:/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/*:/opt/module/hadoop-3.1.3/share/hadoop/yarn:/opt/module/hadoop-3.1.3/share/hadoop/yarn/lib/*:/opt/module/hadoop-3.1.3/share/hadoop/yarn/*

	</value>

	</property>

mapred-site.xml 添加配置项

<!-- 指定MR运行在Yarn上 -->

	<property>

		<name>mapreduce.framework.name</name>

		<value>yarn</value>

	</property>

	<!-- 历史服务器端地址 -->

	<property>

		<name>mapreduce.jobhistory.address</name>

		<value>hadoop104:10020</value>

	</property>

	<!-- 历史服务器web端地址 -->

	<property>

		<name>mapreduce.jobhistory.webapp.address</name>

		<value>hadoop104:19888</value>

	</property>

workers (hadoop根目录/etc/hadoop/workers)

hadoop104(改为自己的地址或映射)

zookeeper

zookeeper/conf 下

zoo.cfg

# The number of milliseconds of each tick

tickTime=2000

# The number of ticks that the initial

# synchronization phase can take

initLimit=10

# The number of ticks that can pass between

# sending a request and getting an acknowledgement

syncLimit=5

# the directory where the snapshot is stored.

# do not use /tmp for storage, /tmp here is just

# example sakes.

dataDir=/opt/module/zookeeper-3.5.7/zkData

# the port at which the clients will connect

clientPort=2181

# the maximum number of client connections.

# increase this if you need to handle more clients

#maxClientCnxns=60

#

# Be sure to read the maintenance section of the

# administrator guide before turning on autopurge.

#

# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance

#

# The number of snapshots to retain in dataDir

#autopurge.snapRetainCount=3

# Purge task interval in hours

# Set to "0" to disable auto purge feature

#autopurge.purgeInterval=1

4lw.commands.whitelist=*

server.1=hadoop104:2888:3888

zookeeper根目录下创建目录 zkData（根据上边的配置命名）

该目录下创建文件 myid（名称不可变）

内容为 1 （该节点的id，进行选举时使用，虽然只有一台，但是也要写）

hbase

hbase-env.sh 修改与上篇博客相同，不再累述

hbase-site.xml 添加配置项

<property>  

		<name>hbase.rootdir</name>  

		<value>hdfs://hadoop104:8020/hbase</value>  

	</property>

	<property>  

		<name>hbase.cluster.distributed</name>

		<value>true</value>

	</property>

	<property>  

		<name>hbase.zookeeper.quorum</name>

	     <value>hadoop104:2181</value>

	</property>

	<property>  

		<name>hbase.zookeeper.property.dataDir</name>

	     <value>/opt/module/zookeeper-3.5.7/zkData</value>

	</property>

	<property>  

		<name>hbase.unsafe.stream.capability.enforce</name>

	     <value>false</value>

	</property>

regionservers 添加

hadoop104

编写启动、停止脚本

依次开启、停止比较麻烦，写好了脚本供大家使用。

#!/bin/bash

if [ $# -lt 1 ]

then

    echo '输入参数有误'

    exit

fi

case $1 in

start)

    echo '========== start hdfs  =========='

    /opt/module/hadoop-3.1.3/sbin/start-dfs.sh

    echo '========== start yarn  =========='

    /opt/module/hadoop-3.1.3/sbin/start-yarn.sh

   # echo '========== start history  =========='

   # /opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver

    echo '========== start zookeeper ============'

    /opt/module/zookeeper-3.5.7/bin/zkServer.sh start

    echo '========== start hbase ============'

    /opt/module/hbase-2.2.2/bin/start-hbase.sh

;;

stop)

    echo '========== stop hbase ============'

    /opt/module/hbase-2.2.2/bin/stop-hbase.sh

    echo '========== stop zookeeper ============'

    /opt/module/zookeeper-3.5.7/bin/zkServer.sh stop

    echo '========== stop yarn  =========='

    /opt/module/hadoop-3.1.3/sbin/stop-yarn.sh

    echo '========== stop hdfs  =========='

    /opt/module/hadoop-3.1.3/sbin/stop-dfs.sh

;;

esac

总结

以上就是所有的配置项了，配置完成即可使用idea进行API操作了。

搭建伪分布式 hadoop3.1.3 + zookeeper 3.5.7 + hbase 2.2.2的更多相关文章

hadoop搭建伪分布式集群（centos7+hadoop-3.1.0/2.7.7）
目录: Hadoop三种安装模式搭建伪分布式集群准备条件第一部分安装前部署 1.查看虚拟机版本2.查看IP地址3.修改主机名为hadoop4.修改 /etc/hosts5.关闭防火墙6.关闭SE ...
超详细！CentOS 7 + Hadoop3.0.0 搭建伪分布式集群
超详细!CentOS 7 + Hadoop3.0.0 搭建伪分布式集群 ps:本文的步骤已自实现过一遍,在正文部分避开了旧版教程在新版使用导致出错的内容,因此版本一致的情况下照搬执行基本不会有大错误. ...
ubuntu安装伪分布式Hadoop3.1.2
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 本文是基于已经安装好的ubuntu环境上搭建伪分布式hadoop,在 ...
hadoop（二）搭建伪分布式集群
前言前面只是大概介绍了一下Hadoop,现在就开始搭建集群了.我们下尝试一下搭建一个最简单的集群.之后为什么要这样搭建会慢慢的分享,先要看一下效果吧! 一.Hadoop的三种运行模式(启动模式) 1 ...
centos7搭建伪分布式集群
centos7搭建伪分布式集群需要 centos7虚拟机一台: jdk-linux安装包一个 hadoop-2.x安装包1个(推荐2.7.x) 一.设置虚拟机网络为静态IP(最好设成静态,为之后编程 ...
Mac OS X上搭建伪分布式CDH版本Hadoop开发环境
最近在研究数据挖掘相关的东西,在本地 Mac 环境搭建了一套伪分布式的 hadoop 开发环境,采用CDH发行版本,省时省心. 参考来源 How-to: Install CDH on Mac OSX ...
避坑之Hadoop安装伪分布式(Hadoop3.2.0/Ubuntu14.04 64位)
一.安装JDK环境(这个可以网上随意搜一篇教程了照着弄,这里不赘述) 安装成功之后输入输入:java -version 显示如下说明jdk安装成功(我这里是安装JDK8) 二.安装Hadoop3. ...
hadoop3.1.0 HDFS快速搭建伪分布式环境
1.环境准备 CenntOS7环境 JDK1.8-并配置好环境变量下载Hadoop3.1.0二进制包到用户目录下 2.安装Hadoop 1.解压移动 #1.解压tar.gz tar -zxvf ha ...
hadoop2.6.4 搭建伪分布式
安装jdk1.7 http://www.cnblogs.com/zhangXingSheng/p/6228432.html ------------------------------------- ...

随机推荐

HTML/css清除浮动的几种方式
浮动在HTML/CSS布局中十分常见,虽然浮动布局可以实现很多有用的排版效果,但是浮动的元素脱离了文档流,可能造成包含块高度塌陷.下方行框上移等行为.因此在使用浮动实现想要的效果后,通常还需要清除浮动 ...
sock skbuf 结构：
/** * struct sock - network layer representation of sockets * @__sk_common: shared layout with inet_ ...
Mysql的下载，安装，远程连接，密码加密规则修改。
第一次接触mysql,,很多地方不懂,出了很多问题.本来应该在Linux系统中安装mysql的,但是奈何各种电脑限制,所以在公司电脑的Windows service R2 系统上装了mysql数据库. ...
webbug3.0菜鸟笔记1
渗透学习笔记--基础篇--sql注入(字符型)http://bbs.51cto.com/viewthread.php?tid=1148930 渗透学习笔记--基础篇--sql注入(数字型)http:/ ...
centos6 安装和配置PHP 7.0
2015年12月初PHP7正式版发布,迎来自2004年以来最大的版本更新.PHP7最显著的变化就是性能的极大提升,已接近Facebook开发的PHP执行引擎HHVM.在WordPress基准性能测试中 ...
MySQL第01课- CentOS + 单实例MySql编译安装总结
2016年2月,从oracle转向MySql ,碰上几个坑,特此记录总结 1.注意环境变量.配置文件,操作过程不能出错 2.相比rpm方式安装,编译安装方式可以指定安装路径,再说安装是简单活,将来安 ...
应聘阿里，字节跳动，美团必须掌握的Spring IOC与工厂模式
Spring IOC与工厂模式 PS:本文内容较为硬核,需要对java的面向对象.反射.类加载器.泛型.properties.XML等基础知识有较深理解. (一)简单介绍在讲Spring IOC之前 ...
凭借着这份面经，我拿下了字节，美团的offer！
最近经常有粉丝私信问我问了一些诸如秋招该怎么复习的问题,我就想顺便把回答整理发一发.我也是把之前面试的一些经历经验和身边的人面试的经验总结了一下放在下面. 前期准备规划: 如果秋招的话一般过年回来就可 ...
面试半年！三面阿里，四面蚂蚁金服，居然倒在了一个Java集合之Map上？
Map接口 Map与Collection并列存在.用于保存具有映射关系的数据:key-valueMap中的key和value都可以是任何引用类型的数据Map中的key用set来存放,不允许重复,即同一 ...
Xrepo：一个现代化的跨平台 C/C++ 包管理器
xrepo 是一个基于 Xmake 的跨平台 C/C++ 包管理器. 项目源码官方文档它基于 xmake 提供的运行时,但却是一个完整独立的包管理程序,相比 vcpkg/homebrew 此类包管 ...

搭建伪分布式 hadoop3.1.3 + zookeeper 3.5.7 + hbase 2.2.2

安装包

配置