Hadoop入门进阶步步高(二)-文件夹介绍
二、Hadoop文件夹结构
这里重点介绍几个文件夹bin、conf及lib文件夹。
1、$HADOOP_HOME/bin文件夹
|
文件名 |
说明 |
|
hadoop |
用于运行hadoop脚本命令,被hadoop-daemon.sh调用运行,也能够单独运行,一切命令的核心 |
|
hadoop-config.sh |
Hadoop的配置文件 |
|
hadoop-daemon.sh |
通过运行hadoop命令来启动/停止一个守护进程(daemon)。 该命令会被bin文件夹以下全部以“start”或“stop”开头的全部命令调用来运行命令。hadoop-daemons.sh也是通过调用hadoop-daemon.sh来运行优命令的,而hadoop-daemon.sh本身由是通过调用hadoop命令来运行任务。 |
|
hadoop-daemons.sh |
通过运行hadoop命令来启动/停止多个守护进程(daemons),它也是调用hadoop-daemon.sh来完毕的。 |
|
rcc |
The Hadoop record compiler |
|
slaves.sh |
该命令用于向全部的slave机器上发送运行命令 |
|
start-all.sh |
全部启动,它会调用start-dfs.sh及start-mapred.sh |
|
start-balancer.sh |
启动balancer |
|
start-dfs.sh |
启动Namenode、Datanode及SecondaryNamenode |
|
start-jobhistoryserver.sh |
启动Hadoop任务历史守护线程,在须要运行历史服务的机器上运行该命令。 原文: Start hadoop job history daemons. Run this on node where history server need to run |
|
start-mapred.sh |
启动MapReduce |
|
stop-all.sh |
全部停止,它会调用stop-dfs.sh及stop-mapred.sh |
|
stop-balancer.sh |
停止balancer |
|
stop-dfs.sh |
停止Namenode、Datanode及SecondaryNamenode |
|
stop-jobhistoryserver.sh |
停止Hadoop任务历史守护线程 |
|
stop-mapred.sh |
停止MapReduce |
|
task-controller |
任务控制器,这不是一个文本文件。没有被bin以下的shell调用 |
2、$HADOOP_HOME/conf文件夹
|
文件名 |
说明 |
|
capacity-scheduler.xml |
|
|
configuration.xsl |
|
|
core-site.xml |
Hadoop核心全局配置文件。能够其他配置文件里引用该文件里定义的属性。如在hdfs-site.xml及mapred-site.xml中会引用该文件的属性。 该文件的模板文件存在于$HADOOP_HOME/src/core/core-default.xml,可将模板文件复制到conf文件夹,再进行改动。 |
|
fair-scheduler.xml |
|
|
hadoop-env.sh |
Hadoop环境变量 |
|
hadoop-metrics2.properties |
|
|
hadoop-policy.xml |
|
|
hdfs-site.xml |
HDFS配置文件。该模板的属性继承于core-site.xml。 该文件的模板文件存在于$HADOOP_HOME/src/hdfs/hdfs-default.xml,可将模板文件复制到conf文件夹,再进行改动。 |
|
log4j.properties |
Log4j的日志属于文件 |
|
mapred-queue-acls.xml |
MapReduce的队列 |
|
mapred-site.xml |
MapReduce的配置文件,该模板的属性继承于core-site.xml。 该文件的模板文件存在于$HADOOP_HOME/src/mapred/mapredd-default.xml,可将模板文件复制到conf文件夹。再进行改动。 |
|
masters |
用于设置全部secondaryNameNode的名称或IP。每一行存放一个。假设是名称。那么设置的secondaryNameNode名称必须在/etc/hosts有ip映射配置。 |
|
slaves |
用于设置全部slave的名称或IP,每一行存放一个。 假设是名称,那么设置的slave名称必须在/etc/hosts有ip映射配置。 |
|
ssl-client.xml.example |
|
|
ssl-server.xml.example |
|
|
taskcontroller.cfg |
|
|
task-log4j.properties |
3、$HADOOP_HOME/lib文件夹
存放的是Hadoop运行时依赖的的jar包,Hadoop在运行的时候会把lib文件夹以下的jar全部加到classpath中。
假设不想通过HADOOP_CLASSPATH指定自己的JAR文件所在路径。能够把计算须要用的jar全部都复制到lib文件夹中。
Hadoop入门进阶步步高(二)-文件夹介绍的更多相关文章
- Hadoop入门进阶步步高(六)-Hadoop1.x与Hadoop2的差别
六.Hadoop1.x与Hadoop2的差别 1.变更介绍 Hadoop2相比較于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了非常大的提高,Ha ...
- Hadoop入门进阶步步高(五)-搭建Hadoop集群
五.搭建Hadoop集群 上面的步骤,确认了单机能够运行Hadoop的伪分布运行,真正的分布式运行无非也就是多几台slave机器而已,配置方面的有一点点差别,配置起来就很easy了. 1.准备三台se ...
- Hadoop入门进阶步步高(一)-环境准备
前言 Hadoop从存储上来说,是相似于冗余磁盘阵列(RAID)的存储方式.将数据分散存储并提供以提供吞吐量,它的存储系统就是HDFS(Hadoop Distuibute Fils System).从 ...
- Hadoop入门进阶步步高(三)-配置Hadoop
三.配置Hadoop 1.设置$HADOOP_HOME/conf/hadoop-env.sh 这个文件里设置的是Hadoop运行时须要的环境变量,在1.2.1版中共同拥有19个环境变量.例如以下: ...
- (Nginx学习一)安装和启动及对应文件夹介绍
nginx 安装和启动及对应文件夹介绍 1 安装 官网下载nginx文件 http://nginx.org/en/download.html 解压即可 2 文件夹介绍 在解压后nginx压缩包后发现 ...
- Unity——资源文件夹介绍
Unity资源文件夹介绍 1.编辑时 在Asset文件下存在Resources和SteamingAsset文件夹: Resources 只读不可修改,打包时直接写死,没有办法通过热更新替换资源: 可以 ...
- Hadoop入门进阶课程9--Mahout介绍、安装与应用案例
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
- Hadoop入门进阶课程13--Chukwa介绍与安装部署
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
- Hadoop入门进阶课程12--Flume介绍、安装与应用案例
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
随机推荐
- Ubuntu 安装 Courier New字体和雅黑consolas字体
一直觉得Ubuntu下的字体不是很好,但毕竟不影响使用,然后作开发的时候eclipse的字体完全没有windows下的两大适合编成的字体courier new 和consloas .可以使用系统安装字 ...
- oracle学习之第一个存储过程:打印Hello World
数据库对象:表.视图.索引.序列.同义词.存储过程.存储函数 存储过程:指的是存储在数据库中供全部用户程序调用的子程序叫存储过程.存储函数 存储过程和存储函数的同样点:完毕特定功能的程序 存储过程和存 ...
- what's new in vc2015
1. 变量和函数的注解提示非常实用.象C#了. 2.CStdioFile升级了,不再须要象 vc2013中,用CStdioFileEx来修复错误了. 3. 发现再写.
- STM32F407VG (四)时钟配置
1.STM32 F407VG 的starup_stm32f40_41xxx.s的例如以下位置调用 IMPORT SystemInit,之后调用main函数,所以 进入main函数时候就已经自己主动完毕 ...
- jsp的凝视可能会影响页面载入速度
在jsp页面使用"<!-- -->"的凝视,凝视里面的java代码还是会得到运行,能够再查看页面源码上看到运行完毕的内容,这样就会让不希望运行的代码得到运行.影响载入速 ...
- hdu_4707
算是水题一道吧,我也没有建树,看别人又用vector,又用bfs,dfs的,对vector不熟,所以就模拟了一下 #include<iostream> #include<string ...
- C#~异步编程再续~你必须要知道的ThreadPool里的throw
问题依旧存在 之前写过相关文章异步编程的文章,本文主要还是一点补充,之前在IIS经常发w3wp进程无做挂了的情况,但一直没能找到真正的原因,而查找相关资料,找了一些相关的文章,如await和async ...
- 你不知道的JavaScript博文参考书籍
you don't know js系列书籍是谷歌地图开发人员编写,内容非常好,四卷已收集齐全. 笔者打包上传到了CSDN,下载地址: http://download.csdn.net/detail/r ...
- MySQL用户添加和分配权限
mysql数据库insertdelete服务器file mysql> grant 权限1,权限2,…权限n on 数据库名称.表名称 to 用户名@用户地址 identified by ‘连接口 ...
- MySQL数据库学习记录
SELECT子句顺序