start-all.sh脚本现在已经废弃,推荐使用start-dfs.sh和start-yarn.sh分别启动HDFS和YARN。

在新一代的Hadoop里面HDFS称为了统一存储的平台,而YARN成为了统一计算的平台。
(1)调用start-dfs.sh启动HDFS。之后JPS会出现NameNode,DataNode,SecondaryNameNode
(2)调用start-yarn.sh启动YARN。之后JPS会出现ResourceManager,NodeManager
对于每个start脚本首先甚至启动过程中用到的所有脚本,首先都是调用libexec/hadoop-config.sh配置相关环境变量

hadoop-config.sh

设置各种环境变量,包括:
HADOOP_PREFIX   整个Hadoop的安装目录
HADOOP_CONF_DIR   配置文件的目录,一般是Hadoop安装目录下的etc/hadoop/
JAVA_HOME   从操作系统环境变量获取,但是在SSH登陆到slave节点可能会出现问题,所以推荐在hadoop-env.sh中也设置一下。
JAVA_HEAP_MAX   启动每个JVM默认的堆大小,目前是-Xmx1000m
CLASSPATH   找Jar包的地方,一般情况下Jar包存在Hadoop安装目录下的share/hadoop/目录下的common,hdfs,httpfs,mapreduce,tools几个子目录下
HADOOP_LOG_DIR 就是存放日志的地方,默认是Hadoop安装目录下的logs目录,这个很重要,运行中出了问题都是要通过log定位的。
NameNode,DataNode,SecondNameNode,ResourceManager,NodeManager的日志默认都在这个目录下。
不过要注意默认的container的log是在/tmp/logs目录下,害得我找container的log找了很长时间也没找到。
HADOOP_LOGFILE
HADOOP_POLICYFILE
JAVA_LIBRARY_PATH  Java运行时需要通过JNI调用native lib的环境变量。因为在Hadoop代码中与操作系统紧密相关的一些操作和一些压缩算法是有通过C编写的native的系统实现的。就是libhadoop.so和libhdfs.so这样的系统库,通常放在Hadoop安装目录下的lib/native/里面。
HADOOP_OPTS  这个是启动每个JVM时传递过去的参数
HADOOP_COMMON_HOME
HADOOP_HDFS_HOME
YARN_HOME
HADOOP_MAPRED_HOME
这些环境变量是运行Hadoop和YARN程序的环境变量,和我们把Hadoop安装在哪个目录下有关系。

start-dfs.sh

(1)执行hdfs-config.sh设置HDFS专有的环境变量。但是目前貌似没有HDFS专有的环境变量,在这个文件里再次执行了下hadoop-config.sh
(2)启动参数:upgrade,rollback还是正常启动。
(3)然后就是分别调用对应的脚本启动对应的模块
NameNode
DataNode
SecondaryNameNode
ZooKeeper Failover
每个模块都是调用hadoop-daemos.sh启动的。
hadoop-daemons.sh和hadoop-daemon.sh的区别是:前者启动多台机器上的daemon,后者负责在一台机器上启动daemon,前者调用后者。连接这两着的桥梁就是sbin/slave.sh,就是通过ssh登陆到slave机器上,然后在每台slave机器上执行hadoop-daemon.sh。
首先看看hadoop-daemons.sh
这个脚本的参数类似这样:
1
--config /home/orange/hadoop-2.0.0-alpha/etc/hadoop --hostnames localhost --script /home/orange/hadoop-2.0.0-alpha/sbin/hdfs start namenode
因为上面这个例子是启动NameNode,所以带了–hostnames参数,用于指明分别到哪台机器上去运行hadoop-daemon.sh去启动namenode。如果是启动DataNode则不需要这个参数,因为如果不设定这个参数,会通过读取etc/hadoop/slaves文件获取slaves机器信息。
这个脚本的最后有个非常长的命令:
1
exec "$bin/slaves.sh" --config $HADOOP_CONF_DIR cd "$HADOOP_PREFIX" \; "$bin/hadoop-daemon.sh" --config $HADOOP_CONF_DIR "$@"
这个命令表示:在本shell内执行slaves.sh脚本,参数是后面那么一堆东西。
我们去slave.sh那打印出它接收到的参数看看:
1
--config /home/orange/hadoop-2.0.0-alpha/etc/hadoop cd /home/orange/hadoop-2.0.0-alpha ; /home/orange/hadoop-2.0.0-alpha/sbin/hadoop-daemon.sh --config /home/orange/hadoop-2.0.0-alpha/etc/hadoop --script /home/orange/hadoop-2.0.0-alpha/sbin/hdfs start namenode
在这个脚本里面通过ssh登陆到各个slave节点上,然后执行后面的cd进入slave节点的Hadoop安装目录,然后调用hadoop-daemon.sh去执行对应的操作。
hadoop-daemon.sh的参数是
1
localhost: --config /home/orange/hadoop-2.0.0-alpha/etc/hadoop --script /home/orange/hadoop-2.0.0-alpha/sbin/hdfs start namenode
执行hadoop-env.sh设置环境变量,因为即将启动的JVM是由这个shell启动的,所以这个环境变量会传给JVM。
配置启动单点NameNode或者DataNode的运行环境:除了hadoop-config.sh里面的以外还有HADOOP_LOG_DIR,HADOOP_PID_DIR,HADOOP_IDENT_STRING等,这些都是与运行这个daemon的本机相关的变量
最后通过
1
nohup nice -n $HADOOP_NICENESS $hdfsScript --config $HADOOP_CONF_DIR $command "$@" > "$log" 2>&1 < /dev/null &
启动对应的进程,也就是hdfs start namenode命令。其实是调用 bin/hdfs脚本,启动JVM。
hadoop-daemon.sh这个脚本是在每台机器上启动各种JVM前的准备工作,包括设置环境变量什么的。因为每个脚本基本都会调用hadoop-config.sh,这个也不例外,所以我们理解一般情况下hadoop-config.sh里面的环境变量。但是从我的实际使用经验来看,由于操作系统和SSH的问题,会导致SSH登陆到slave节点之后执行shell脚本的时候获取系统环境变量失效的问题。例如,$JAVA_HOME环境变量,看hadoop-config.sh这个文件可知$JAVA_HOME直接从操作系统环境变量获取。但是当hadoop-daemons.sh调用slaves.sh通过ssh登陆到各个slave节点之后去执行hadoop-daemon.sh时,在获取$JAVA_HOME时出现失败的情况。而如果在对应的那台机器上执行 echo $JAVA_HOME是没有问题的。也就是SSH之后的环境变量获取失败。我的debian上就出现了这个问题,这个坑害死人。而在我的CentOS上却没有这样的问题。通过搜索网络得知是因为~/.bashrc不会被SSH调用,而~/.bash_profile或者~/.profile是会被SSH调用的。所以需要在~/.bash_profile或者~/.profile中通过类似下面的语句执行~/.bashrc
1
2
3
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
但是在我的debian上还是搞不定,至今原因未明。有对Debian熟悉的同学如果知道是什么原因可以Email我。
还好hadoop社区为了防止类似的问题,也做了很严谨的策略。在SSH登陆到每台slave之后,都会去调用hadoop-env.sh。这个文件很重要啊。我在看别人的攻略时,看别人在说要在这个hadoop-env.sh文件里设置$JAVA_HOME,但是就在想,我的系统环境变量里已经设置了$JAVA_HOME,难道你一个应用程序的环境变量比我系统的还管用?所以就试了下这个hadoop-env.sh不设置$JAVA_HOME,结果就出现了上面所说的问题。看来hadoop-env.sh正如其名,有关Hadoop的环境变量应该设置在这里,这样才能在社么样的底层系统环境下都能稳定运行。

start-yarn.sh

注意到这个脚本里不再执行hadoop-config.sh,而是执行yarn-config.sh。配置环境变量。(实际上yarn-config.sh还是会调用hadoop-config.sh的)
1
"$bin"/yarn-daemon.sh --config $YARN_CONF_DIR  start resourcemanager
指定日志和pid的格式,也就是:yarn-orange-nodemanager-orange.log
yarn-orange-resourcemanager-orange.log
yarn-orange-nodemanager.pid
yarn-orange-resourcemanager.pid
通过执行下面这行代码,启动ResourceManager对应的JVM
1
nohup nice -n $YARN_NICENESS "$YARN_HOME"/bin/yarn --config $YARN_CONF_DIR $command "$@" &gt; "$log" 2&gt;&amp;1 &lt; /dev/null &amp;
1
"$bin"/yarn-daemons.sh --config $YARN_CONF_DIR  start nodemanager
和启动DataNode类似,也是通过SSH到每台slave节点上之后,执行yarn-daemon.sh启动对应的NodeManager。
1
exec "$bin/slaves.sh" --config $YARN_CONF_DIR cd "$YARN_HOME" \; "$bin/yarn-daemon.sh" --config $YARN_CONF_DIR "$@"
注意这里面也存在和上面一样的问题,所以推荐在yarn-env.sh里面也设置相关环境变量,要不然就会出现启动Job的时候找不到类。。。
总的来说这个启动过程分为多个层次,分别是:整个集群级别的配置,单台机器OS级别的配置,单个JVM级别的配置。
对那句话“系统总是不可靠的,我们要通过软件冗余来使得系统更加可靠”有了更深层次的认识。

Hadoop 2.0+YARN启动脚本分析与实战经验的更多相关文章

  1. Hadoop 启动脚本分析与实战经验

    start-all.sh脚本现在已经废弃,推荐使用start-dfs.sh和start-yarn.sh分别启动HDFS和YARN. 在新一代的Hadoop里面HDFS称为了统一存储的平台,而YARN成 ...

  2. Hadoop启动脚本分析

    Hadoop启动脚本分析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 能看到这篇博客的你估计对Hadoop已经有一个系统的了解了,最起码各种搭建方式你应该是会的,不会也没有关系, ...

  3. 4. hadoop启动脚本分析

    4. hadoop启动脚本分析 1. hadoop的端口 ``` 50070 //namenode http port 50075 //datanode http port 50090 //2name ...

  4. Spark配置&启动脚本分析

    本文档基于Spark2.0,对spark启动脚本进行分析. date:2016/8/3 author:wangxl Spark配置&启动脚本分析 我们主要关注3类文件,配置文件,启动脚本文件以 ...

  5. HBase配置&启动脚本分析

    本文档基于hbase-0.96.1.1-cdh5.0.2,对HBase配置&启动脚本进行分析 date:2016/8/4 author:wangxl HBase配置&启动脚本分析 剔除 ...

  6. hadoop启动脚本分析及常见命令

    进程------------------ [hdfs]start-dfs.sh NameNode NN DataNode DN SecondaryNamenode 2NN [yarn]start-ya ...

  7. busybox rootfs 启动脚本分析(二)

    上次分析了busybox的启动脚本,这次分析一下init.d中一些脚本的内容. 参考链接 http://www.cnblogs.com/helloworldtoyou/p/6169678.html h ...

  8. busybox rootfs 启动脚本分析(一)

    imx6文件系统启动脚本分析.开机运行/sbin/init,读取/etc/inittab文件,进行初始化. 参考链接 http://blog.163.com/wghbeyond@126/blog/st ...

  9. linux系统 initrd.img中init启动脚本分析

    概述:这篇文章主体内容来源于网上转载.前面几篇文章倾向于制作initrd.img,这篇文章更倾向于initrd.img的运行过程:加载framebuff驱动 ide驱动和文件系统驱动,最后进入到真正的 ...

随机推荐

  1. qq互联(connect.qq.com)取用户信息的方法

    <?php //应用的APPID$app_id = "YOUR_APP_ID";//应用的APPKEY$app_secret = "YOUR_APP_KEY&quo ...

  2. POJ 1904 King's Quest ★(强连通分量:可行完美匹配边)

    题意 有n个女生和n个男生,给定一些关系表示男生喜欢女生(即两个人可以结婚),再给定一个初始匹配,表示这个男生和哪个女生结婚,初始匹配必定是合法的.求每个男生可以和哪几个女生可以结婚且能与所有人不发生 ...

  3. RPi 2B Raspbian SD卡内部架构

    /***************************************************************************** * RPi 2B Raspbian SD卡 ...

  4. Mac下配置PHP+Apache+phpMyAdmin+MySql远程链接

    最近的项目是微信公众号平台的开发,微信官方给出的Demo是PHP的,发现大部分的学习资料也是PHP,那好吧,放弃Java,来段儿PHP吧 下面说说Mac下搭建PHP环境 数据库:MySQL-5.6.2 ...

  5. 【Mac】Mac键盘实现Home, End, Page UP, Page DOWN

     * Home键=Fn+左方向    * End键=Fn+右方向    * PageUP=Fn+上方向    * PageDOWN=Fn+下方向    * 向后删除=Fn+delete  * Find ...

  6. getDeclaredMethods()和getMethods()区别

    getDeclaredMethods()          返回 Method 对象的一个数组,这些对象反映此 Class 对象表示的类或接口声明的所有方法,包括公共.保护.默认(包)访问和私有方法, ...

  7. linux命令——磁盘管理cd

    Linux cd 命令可以说是Linux中最基本的命令语句,其他的命令语句要进行操作,都是建立在使用 cd 命令上的. cd指令可让用户在不同的目录间切换,但该用户必须拥有足够的权限进入目的目录. 1 ...

  8. MFC ListControl用法

    http://blog.csdn.net/lovton/article/details/6527208 1.建立一个对象m_LogList 步骤:在对话listcontrol控件右键点击添加变量-&g ...

  9. SQL遍历字符串的方法

    字符串穿越: 1.创建一个只存递增序列(1…n)的表——Temp,并将它与目标字符串所在的表Src进行笛卡尔运算.(Temp表的记录数要不小于遍历的目标字符串的长度) 2.过滤掉序列值大于串长的行. ...

  10. 在ASM中移动数据文件

    实验目的:在ASM存储环境下,要删除一个磁盘组,从而将磁盘组中的数据文件移动到另外一个磁盘组中. 查看数据文件存放的位置: SQL> select file#,name from v$dataf ...