Hadoop入门进阶步步高(二)-文件夹介绍
二、Hadoop文件夹结构
这里重点介绍几个文件夹bin、conf及lib文件夹。
1、$HADOOP_HOME/bin文件夹
| 
 文件名  | 
 说明  | 
| 
 hadoop  | 
 用于运行hadoop脚本命令,被hadoop-daemon.sh调用运行,也能够单独运行,一切命令的核心  | 
| 
 hadoop-config.sh  | 
 Hadoop的配置文件  | 
| 
 hadoop-daemon.sh  | 
 通过运行hadoop命令来启动/停止一个守护进程(daemon)。 该命令会被bin文件夹以下全部以“start”或“stop”开头的全部命令调用来运行命令。hadoop-daemons.sh也是通过调用hadoop-daemon.sh来运行优命令的,而hadoop-daemon.sh本身由是通过调用hadoop命令来运行任务。  | 
| 
 hadoop-daemons.sh  | 
 通过运行hadoop命令来启动/停止多个守护进程(daemons),它也是调用hadoop-daemon.sh来完毕的。  | 
| 
 rcc  | 
 The Hadoop record compiler  | 
| 
 slaves.sh  | 
 该命令用于向全部的slave机器上发送运行命令  | 
| 
 start-all.sh  | 
 全部启动,它会调用start-dfs.sh及start-mapred.sh  | 
| 
 start-balancer.sh  | 
 启动balancer  | 
| 
 start-dfs.sh  | 
 启动Namenode、Datanode及SecondaryNamenode  | 
| 
 start-jobhistoryserver.sh  | 
 启动Hadoop任务历史守护线程,在须要运行历史服务的机器上运行该命令。 原文: Start hadoop job history daemons. Run this on node where history server need to run  | 
| 
 start-mapred.sh  | 
 启动MapReduce  | 
| 
 stop-all.sh  | 
 全部停止,它会调用stop-dfs.sh及stop-mapred.sh  | 
| 
 stop-balancer.sh  | 
 停止balancer  | 
| 
 stop-dfs.sh  | 
 停止Namenode、Datanode及SecondaryNamenode  | 
| 
 stop-jobhistoryserver.sh  | 
 停止Hadoop任务历史守护线程  | 
| 
 stop-mapred.sh  | 
 停止MapReduce  | 
| 
 task-controller  | 
 任务控制器,这不是一个文本文件。没有被bin以下的shell调用  | 
2、$HADOOP_HOME/conf文件夹
| 
 文件名  | 
 说明  | 
| 
 capacity-scheduler.xml  | 
|
| 
 configuration.xsl  | 
|
| 
 core-site.xml  | 
 Hadoop核心全局配置文件。能够其他配置文件里引用该文件里定义的属性。如在hdfs-site.xml及mapred-site.xml中会引用该文件的属性。 该文件的模板文件存在于$HADOOP_HOME/src/core/core-default.xml,可将模板文件复制到conf文件夹,再进行改动。  | 
| 
 fair-scheduler.xml  | 
|
| 
 hadoop-env.sh  | 
 Hadoop环境变量  | 
| 
 hadoop-metrics2.properties  | 
|
| 
 hadoop-policy.xml  | 
|
| 
 hdfs-site.xml  | 
 HDFS配置文件。该模板的属性继承于core-site.xml。 该文件的模板文件存在于$HADOOP_HOME/src/hdfs/hdfs-default.xml,可将模板文件复制到conf文件夹,再进行改动。  | 
| 
 log4j.properties  | 
 Log4j的日志属于文件  | 
| 
 mapred-queue-acls.xml  | 
 MapReduce的队列  | 
| 
 mapred-site.xml  | 
 MapReduce的配置文件,该模板的属性继承于core-site.xml。 该文件的模板文件存在于$HADOOP_HOME/src/mapred/mapredd-default.xml,可将模板文件复制到conf文件夹。再进行改动。  | 
| 
 masters  | 
 用于设置全部secondaryNameNode的名称或IP。每一行存放一个。假设是名称。那么设置的secondaryNameNode名称必须在/etc/hosts有ip映射配置。  | 
| 
 slaves  | 
 用于设置全部slave的名称或IP,每一行存放一个。 假设是名称,那么设置的slave名称必须在/etc/hosts有ip映射配置。  | 
| 
 ssl-client.xml.example  | 
|
| 
 ssl-server.xml.example  | 
|
| 
 taskcontroller.cfg  | 
|
| 
 task-log4j.properties  | 
3、$HADOOP_HOME/lib文件夹
存放的是Hadoop运行时依赖的的jar包,Hadoop在运行的时候会把lib文件夹以下的jar全部加到classpath中。
假设不想通过HADOOP_CLASSPATH指定自己的JAR文件所在路径。能够把计算须要用的jar全部都复制到lib文件夹中。
Hadoop入门进阶步步高(二)-文件夹介绍的更多相关文章
- Hadoop入门进阶步步高(六)-Hadoop1.x与Hadoop2的差别
		
六.Hadoop1.x与Hadoop2的差别 1.变更介绍 Hadoop2相比較于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了非常大的提高,Ha ...
 - Hadoop入门进阶步步高(五)-搭建Hadoop集群
		
五.搭建Hadoop集群 上面的步骤,确认了单机能够运行Hadoop的伪分布运行,真正的分布式运行无非也就是多几台slave机器而已,配置方面的有一点点差别,配置起来就很easy了. 1.准备三台se ...
 - Hadoop入门进阶步步高(一)-环境准备
		
前言 Hadoop从存储上来说,是相似于冗余磁盘阵列(RAID)的存储方式.将数据分散存储并提供以提供吞吐量,它的存储系统就是HDFS(Hadoop Distuibute Fils System).从 ...
 - Hadoop入门进阶步步高(三)-配置Hadoop
		
三.配置Hadoop 1.设置$HADOOP_HOME/conf/hadoop-env.sh 这个文件里设置的是Hadoop运行时须要的环境变量,在1.2.1版中共同拥有19个环境变量.例如以下: ...
 - (Nginx学习一)安装和启动及对应文件夹介绍
		
nginx 安装和启动及对应文件夹介绍 1 安装 官网下载nginx文件 http://nginx.org/en/download.html 解压即可 2 文件夹介绍 在解压后nginx压缩包后发现 ...
 - Unity——资源文件夹介绍
		
Unity资源文件夹介绍 1.编辑时 在Asset文件下存在Resources和SteamingAsset文件夹: Resources 只读不可修改,打包时直接写死,没有办法通过热更新替换资源: 可以 ...
 - Hadoop入门进阶课程9--Mahout介绍、安装与应用案例
		
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
 - Hadoop入门进阶课程13--Chukwa介绍与安装部署
		
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
 - Hadoop入门进阶课程12--Flume介绍、安装与应用案例
		
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
 
随机推荐
- js中“原生”map
			
var map = {}; // Map map = new HashMap(); map[key] = value; // map.put(key, value); var value = map[ ...
 - 指尖上的电商---(5)schema.xml配置具体解释
			
这一节我们看下schema.xml文件中各个节点的配置极其作用.schema.xml文件中面主要定义了索引数据类型,索引字段等信息. 主要包含了下面节点 1.fieldtype节点 fieldtype ...
 - 【Linux】进程调度概述
			
1 可运行队列 (基于实时进程调度) 调度程序中最主要的数据结构式运行队列(runqueue).可运行队列是给定处理器上的可运行进程的链表,每一个处理器一个. 每一个可投入运行的进程都唯一的归属于一个 ...
 - 在Redhat Linux中执行非Redhat的Openstack, Redhat将对其Linux不提供支持
			
一声叹息. IBM.HP.Dell, Mirantis, Piston等.请问.你们还把你们的Openstack部署在Redhat中吗? http://blogs.wsj.com/digits/201 ...
 - nova shelve 的使用
			
对于云中的资源我们常有例如以下需求 1,用户对临时不使用的VM进行停止操作.以节省费用. 2.对于长时间未使用的VM.管理员想要从hypervisor层面上清除它们从而节省主机资源. 3.但之前的停止 ...
 - hibernate之4.延迟载入
			
延迟载入: 仅仅有当使用以实体对象的属性(除主键属性外)时,才会发送查询语句到数据库 get不支持延迟载入 @Test public void getTest(){ Session session=n ...
 - git使用(公钥私钥产生--远程库添加公钥--本地库关联远程库-使用)
			
原文1:http://www.cnblogs.com/wangmingshun/p/5424767.html 原文2(指令):http://blog.csdn.net/xiaohanluo/artic ...
 - java类型与Hadoop类型之间的转换
			
java基本类型与Hadoop常见基本类型的对照Long LongWritableInteger IntWritableBoolean BooleanWritable String Text ...
 - Edge 浏览器
			
Edge浏览器设计理念 无法播放:https://edgewelcomecdn.microsoft.com/site/images/tabs/rs3/tabs_screen.acd367a2.mp4 ...
 - Homebrew的安装及使用
			
Homebrew是Mac上的软件包管理工具,能在Mac中方便的搜索安装卸载软件. 1 安装 在终端输入一下代码,回车,即可下载. ruby -e "$(curl -fsSL https:/ ...