【Hadoop】伪分布式环境搭建、验证

Hadoop伪分布式环境搭建：

自动部署脚本：

#!/bin/bash

set -eux

export APP_PATH=/opt/applications

export APP_NAME=Ares

# 安装apt依赖包

apt-get update -y \

    && apt-get install supervisor -y \

    && apt-get install python-dev python-pip libmysqlclient-dev -y

# 安装pip、python依赖

pip install --upgrade pip \

    && pip install -r ./build-depends/pip-requirements/requirements.txt

# 安装JDK

tar -xzvf ./build-depends/jdk-package/jdk-7u60-linux-x64.tar.gz \

    && ln -s jdk1..0_60/ jdk

# 配置JAVA环境变量

echo -e '\n' >> /etc/profile

echo '# !!!No Modification, This Section is Auto Generated by '${APP_NAME} >> /etc/profile

echo 'export JAVA_HOME='${APP_PATH}/${APP_NAME}/jdk >> /etc/profile

echo 'export JRE_HOME=${JAVA_HOME}/jre' >> /etc/profile

echo 'export CLASSPATH=.:${JAVA_HOME}/jre/lib/rt.jar:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar' >> /etc/profile

echo 'export PATH=${PATH}:${JAVA_HOME}/bin:${JRE_HOME}/bin' >> /etc/profile

source /etc/profile && java -version

# 安装Hadoop

tar -xzvf ./build-depends/hadoop-package/hadoop-2.5..tar.gz \

    && ln -s hadoop-2.5. hadoop

# hadoop-env.sh配置JAVA_HOME

mv ./hadoop/etc/hadoop/hadoop-env.sh ./hadoop/etc/hadoop/hadoop-env.sh.bak \

    && cp -rf ./build-depends/hadoop-conf/hadoop-env.sh ./hadoop/etc/hadoop/ \

    && sed -i "25a export JAVA_HOME=${APP_PATH}/${APP_NAME}/jdk" ./hadoop/etc/hadoop/hadoop-env.sh

# core-site.xml配置

mv ./hadoop/etc/hadoop/core-site.xml ./hadoop/etc/hadoop/core-site.xml.bak \

    && python ./build-utils/configueUpdate/templateInvoke.py ./build-depends/hadoop-conf/core-site.xml ./hadoop/etc/hadoop/core-site.xml

# hdfs-site.xml配置

mv ./hadoop/etc/hadoop/hdfs-site.xml ./hadoop/etc/hadoop/hdfs-site.xml.bak \

    && python ./build-utils/configueUpdate/templateInvoke.py ./build-depends/hadoop-conf/hdfs-site.xml ./hadoop/etc/hadoop/hdfs-site.xml

# mapred-site.xml配置

python ./build-utils/configueUpdate/templateInvoke.py ./build-depends/hadoop-conf/mapred-site.xml.template ./hadoop/etc/hadoop/mapred-site.xml

# yarn-site.xml配置

mv ./hadoop/etc/hadoop/yarn-site.xml ./hadoop/etc/hadoop/yarn-site.xml.bak \

    && python ./build-utils/configueUpdate/templateInvoke.py ./build-depends/hadoop-conf/yarn-site.xml ./hadoop/etc/hadoop/yarn-site.xml

# slaves, 即DataNode配置

mv ./hadoop/etc/hadoop/slaves ./hadoop/etc/hadoop/slaves.bak

DataNodeList=(`echo ${DataNodeList} | tr ";" "\n"`)

for DataNode in ${DataNodeList}; do

    echo ${DataNode} >> ./hadoop/etc/hadoop/slaves

done

# 配置Hadoop环境变量

echo -e '\n' >> /etc/profile

echo '# !!!No Modification, This Section is Auto Generated by '${APP_NAME} >> /etc/profile

echo 'export HADOOP_HOME='${APP_PATH}/${APP_NAME}/hadoop >> /etc/profile

echo 'export PATH=${PATH}:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin' >> /etc/profile

source /etc/profile && hadoop version

# Namenode格式化

# hadoop namenode -format -force

hdfs namenode -format -force

# 启动hdfs、yarn

stop-dfs.sh && start-dfs.sh && jps

stop-yarn.sh && start-yarn.sh && jps

# hdfs测试

# hadoop fs -put ./build-depends/jdk-package/jdk-7u60-linux-x64.tar.gz hdfs://HADOOP-NODE1:9000/

hdfs dfs -put ./build-depends/jdk-package/jdk-7u60-linux-x64.tar.gz hdfs://HADOOP-NODE1:9000/

# hadoop fs -get hdfs://HADOOP-NODE1:9000/jdk-7u60-linux-x64.tar.gz .

hdfs dfs -get hdfs://HADOOP-NODE1:9000/jdk-7u60-linux-x64.tar.gz .

rm -rf jdk-7u60-linux-x64.tar.gz

# mapred测试

hadoop jar ./hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5..jar pi  

# word-count测试

touch word-count.txt    \

    && echo "hello world" >> word-count.txt \

    && echo "hello tom" >> word-count.txt \

    && echo "hello jim" >> word-count.txt \

    && echo "hello kitty" >> word-count.txt \

    && echo "hello baby" >> word-count.txt

# hadoop fs -put word-count.txt hdfs://HADOOP-NODE1:9000/

# hadoop fs -rm hdfs://HADOOP-NODE1:9000/word-count.txt

hadoop fs -mkdir hdfs://HADOOP-NODE1:9000/word-count

hadoop fs -mkdir hdfs://HADOOP-NODE1:9000/word-count/input

# hadoop fs -mkdir hdfs://HADOOP-NODE1:9000/word-count/output

# hadoop fs -rmdir hdfs://HADOOP-NODE1:9000/word-count/output

hadoop fs -put word-count.txt hdfs://HADOOP-NODE1:9000/word-count/input

hadoop jar ./hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5..jar wordcount hdfs://HADOOP-NODE1:9000/word-count/input hdfs://HADOOP-NODE1:9000/word-count/output

hadoop fs -ls hdfs://HADOOP-NODE1:9000/word-count/output

hadoop fs -cat hdfs://HADOOP-NODE1:9000/word-count/output/part-r-00000

# supervisord 配置文件

#cp ${APP_PATH}/supervisor.conf.d/*.conf /etc/supervisor/conf.d/

# start supervisord nodaemon

# /usr/bin/supervisord --nodaemon

#/usr/bin/supervisord

运行脚本：

# 此处描述应用运行命令使用方法.

export APP_PATH=/opt/applications

export APP_NAME=Ares

export APP_Version=2.5.

# 单节点-伪分布式

#HOSTNAME           IP              HDFS                                YARN

#HADOOP-NODE1       10.20.0.11      NameNode/SNameNode/DataNode         NodeManager/ResourceManager

export NameNode_HOST=HADOOP-NODE1

export NameNode_RPCPort=

export NameNode_HTTP_PORT=

export SNameNode_HOST=HADOOP-NODE1

export SNameNode_HTTP_PORT=

export SNameNode_HTTPS_PORT=

export HDFS_Replication=

export YARN_RSC_MGR_HOST=HADOOP-NODE1

export YARN_RSC_MGR_HTTP_PORT=

export YARN_RSC_MGR_HTTPS_PORT=

export DataNodeList='HADOOP-NODE1'

mkdir -p ${APP_PATH}/${APP_NAME} \

    && mv ${APP_NAME}-${APP_Version}.zip ${APP_PATH}/${APP_NAME}/ \

    && cd ${APP_PATH}/${APP_NAME}/ \

    && unzip ${APP_NAME}-${APP_Version}.zip \

    && chmod a+x run.sh \

    && ./run.sh

ssh免密码登录过程：

【Hadoop】伪分布式环境搭建、验证的更多相关文章

【Hadoop离线基础总结】CDH版本Hadoop 伪分布式环境搭建
CDH版本Hadoop 伪分布式环境搭建服务规划步骤第一步:上传压缩包并解压 cd /export/softwares/ tar -zxvf hadoop-2.6.0-cdh5.14.0.tar ...
CentOS7下Hadoop伪分布式环境搭建
CentOS7下Hadoop伪分布式环境搭建前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...
《OD大数据实战》Hadoop伪分布式环境搭建
一.安装并配置Linux 8. 使用当前root用户创建文件夹,并给/opt/下的所有文件夹及文件赋予775权限,修改用户组为当前用户 mkdir -p /opt/modules mkdir -p / ...
Hadoop伪分布式环境搭建+Ubuntu:16.04+hadoop-2.6.0
Hello,大家好 !下面就让我带大家一起来搭建hadoop伪分布式的环境吧!不足的地方请大家多交流.谢谢大家的支持准备环境: 1, ubuntu系统,(我在16.04测试通过.其他版本请自行测试, ...
hadoop伪分布式环境搭建
环境:Centos6.9+jdk+hadoop1.下载hadoop的tar包,这里以hadoop2.6.5版本为例,下载地址https://archive.apache.org/dist/hadoop ...
hadoop伪分布式环境搭建之linux系统安装教程
本篇文章是接上一篇<超详细hadoop虚拟机安装教程(附图文步骤)>,上一篇有人问怎么没写hadoop安装.在文章开头就已经说明了,hadoop安装会在后面写到,因为整个系列的文章涉及到每 ...
Hadoop学习笔记1：伪分布式环境搭建
在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下: 1.CentOS 6.7下安装JDK , 地址: http://blog.csdn.net/yule ...
Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
hive-2.2.0 伪分布式环境搭建
一,实验环境: 1, ubuntu server 16.04 2, jdk,1.8 3, hadoop 2.7.4 伪分布式环境或者集群模式 4, apache-hive-2.2.0-bin.tar. ...

随机推荐

python基础复习-1-2 数据类型-str、list、tuple、dict
数据类型数字引号: 123 数值 '123' 字符串整数:ini long 范围:(-2**31 - 2**31) num = 123 长整型 long (L) num = 123L 浮点型:f ...
django日志的设置
关于django的日志设置详细可以看下官方文档:https://yiyibooks.cn/xx/Django_1.11.6/topics/logging.html 示例: # 日志文件配置 LOGGI ...
作业执行器Job Executor
Job Executor 激活作业执行器 AsyncExecutor是一个组件,它管理线程池,来触发计时器和其他异步任务.其他实现也是可能的(例如使用消息队列,请参阅用户指南的高级部分). 默认情况下 ...
解决 WP迁移后出现的404错误
项目迁移 WordPress 后仅首页正常,其它页面全部 404.时隔一年,再度遇到这问题,总结和梳理一下. 1.想办法登录后台,刷新一次“设置”中的“固定链接”.比如换成默认后保存,再设回原先设置并 ...
MBProgressHUD自定义视图大小的修改
MBProgressHUD 一款简单易用的弹窗,但是在使用中难免使用自定义view即customView,此时会发现HUD的弹窗大小和你image的大小是一样的无论你怎么修改frame也没有用,此时你 ...
C#关于log4net(Log For Net)
1 介绍 log4net(Log For Net)是Apache开源的应用于.Net框架的日志记录工具,详细信息参见Apache网站.它是针对Java的log4j(Log For Java ...
JS / jquery 实现页面面板拖动 QQ网页版登陆页面拖动
参考:慕课网DOM实践探秘 http://www.imooc.com/learn/138 实现需求:点击页面头部,可以拖动面板.使用js原生和jquery 各实现一次. 可以学到:1.鼠标在当前页面的 ...
Python timedelta模块时间增减用法
timedalte 是datetime中的一个对象,该对象表示两个时间的差值构造函数:datetime.timedelta(days=0, seconds=0, microseconds=0, mi ...
[thinkphp] ajaxReturn案例
javascript: <script> $('.ajax-post').click(function(){ var action_url=$('form').attr('action') ...
[jquery] ajax parsererror
http://stackoverflow.com/questions/5061310/jquery-returning-parsererror-for-ajax-request 方法一: 直接去掉 d ...

【Hadoop】伪分布式环境搭建、验证

【Hadoop】伪分布式环境搭建、验证的更多相关文章

随机推荐

热门专题