5，Hadoop中的文件

1，文件结构

· bin：脚本和命令目录。

· etc：配置文件目录。

· sbin：命令目录，主要包含HDFS和YARN中各类服务的启动和关闭，依赖于bin中的脚本。

· share：各个模块编译后的jar包，和示例代码。

· libexec：各个服务的shell配置文件目录，比如配置日志输出目录、启动参数等。

· include：对外提供的头文件，由C++定义。

· lib：对外的动态库，与include 对应。

2，core-default.xml

··· hadoop的默认配置文件，位于./share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml

其他的配置文件也一样

3，core-site.xml

··· fs.defaultFS

· 设置运行时的文件系统，默认是 [file:///] 即本地文件系统。

· 对于分布式Hadoop必须设置为 HDFS，[hdfs://hadoop11:9000]，hadoop11:9000为NameNode所在的主机和端口

··· hadoop.tmp.dir

· hadoop的临时文件夹，一般为 [/opt/app/hadoop/data/tmp]。会保存hdfs的NameNode的信息和DataNode的数据

4，hdfs-site.xml

··· dfs.replication

· hdfs的副本个数，默认为3。在伪分布式中要设置为1。

··· dfs.namenode.http-address

· NameNode的web访问地址，即在浏览器上查看NameNode上的信息。一般为 [hadoop11:50070]

··· dfs.namenode.secondary.http-address

· SecondaryNameNode的web访问地址。一般为 [hadoop33:50090]

··· dfs.permissions.enabled

· HDFS的文件系统权限。一般设为 [false]

5，yarn-site.xml

··· yarn.resourcemanager.hostname

· 设置RM主机的位置。一般为 [hadoop22]

··· yarn.nodemanager.aux-services

· 一般为 [mapreduce_shuffle]，通知NodeManager实现名为mapreduce.shuffle的辅助服务

··· yarn.log-aggregation-enable

· 设置日志聚集属性，一般打开，设为 [true]

··· yarn.log-aggragation.retain-seconds

· 设置日志聚集的时间，单位秒，一般为7天，设为 [604800]

6，mapred-site.xml

··· mapreduce.framework.name

· MapReduce的计算框架，可以是 local、classic、yarn，一般设为 yarn，默认是local

··· mapreduce.jobhistory.address

· 历史服务器的地址，一般设为 [hadoop33:10020]

··· mapreduce.jobhistory.webapp.address

· 历史服务器的web访问地址，一般设为 [hadoop33:19888]

7，slaves

··· 设置从主机的主机名(不能有空格)

· 当启动 hdfs时，会在配置的主机中启动 DataNode进程。

· 当启动 yarn时，会在配置的主机中启动 NodeManager进程。

5，Hadoop中的文件的更多相关文章

Hadoop中pid文件存储
我的hadoop集群部署在自己电脑虚拟机上,有时候我是挂起虚拟机,第二天再打开发现有些线程就挂了,比如namenode,好奇怪,当时看了一些帖子说是和pid存储有关,找到log看到找不到pid.因为基 ...
转载：查看HADOOP中一个文件有多少块组成及所在机器ip
看文件信息 hadoop fsck /user/filename 更详细的 hadoop fsck /user/filename -files -blocks -locations -racks ...
hadoop中发送文件的脚本
多台主机执行相同的命令 [xcall] [/usr/local/bin] sudo nano xcall ----------------------------------------------- ...
MapReduce计算之——hadoop中的Hello World
1. 启动集群 2. 创建input路径(有关hadoop 的命令用 "hadoop fs"),input路径并不能在系统中查找到,可以使用 “hadoop fs -ls /” ...
浅谈hadoop中mapreduce的文件分发
近期在做数据分析的时候.须要在mapreduce中调用c语言写的接口.此时就须要把动态链接库so文件分发到hadoop的各个节点上,原来想自己来做这个分发,大概过程就是把so文件放在hdfs上面,然后 ...
在本机eclipse中创建maven项目，查看linux中hadoop下的文件、在本机搭建hadoop环境
注意第一次建立maven项目时需要在联网情况下,因为他会自动下载一些东西,不然突然终止需要手动删除断网前建立的文件在eclipse里新建maven项目步骤直接新建maven项目出了错 ...
直接使用FileSystem以标准输出格式显示hadoop文件系统中的文件
package com.yoyosys.cebbank.bdap.service.mr; import java.io.IOException; import java.io.InputStream; ...
hadoop中两种上传文件方式
记录如何将本地文件上传至HDFS中前提是已经启动了hadoop成功(nodedate都成功启动) ①先切换到HDFS用户 ②创建一个user件夹 bin/hdfs dfs -mkdir /user ...
hadoop学习笔记（十）：hdfs在命令行的基本操作命令（包括文件的上传和下载和hdfs中的文件的查看等）
hdfs命令行 ()查看帮助 hdfs dfs -help ()查看当前目录信息 hdfs dfs -ls / ()上传文件 hdfs dfs -put /本地路径 /hdfs路径 ()剪切文件 hd ...

随机推荐

Python_运维中常用的20个库和模块
1.psutil是一个跨平台库(https://github.com/giampaolo/psutil)能够实现获取系统运行的进程和系统利用率(内存,CPU,磁盘,网络等),主要用于系统监控,分析和系 ...
LeetCode No.88,89,90
No.88 Merge 合并两个有序数组题目给定两个有序整数数组 nums1 和 nums2,将 nums2 合并到 nums1 中,使得 num1 成为一个有序数组. 说明: 初始化 nums1 ...
day13-面向对象
#解决同一类问题,使用面向对象的思想.类是制造对象的模具,类是抽象的,我们能知道它有哪些属性(name,age,saraly),但不知道具体的属性值. #看下面代码:类Penson制造了实例化对象re ...
Apsara Clouder云计算专项技能认证：网站建设-部署与发布
一.课程学习介绍和学习目标 1.学习内容掌握如何将一个本地已经设计好的静态网站发布到Internet公共互联网,通过自己的域名让全世界的网民访问到,如何完成工信部的ICP备案,实现监管合规. 2.学 ...
Oracle中的 timestamp 和 timestamp with time zone, timestamp with local time zone
SQL> select dbtimezone, sessiontimezone from dual; DBTIME ------ SESSIONTIMEZONE ---------------- ...
python--包package、模块module、类Class、Mixin类（未完成）
包package>模块module>类Class(包含了属性.方法.实例等概念) 模式一:一个包下面有多个py文件,即多个模块module 模式二:一个包下面包含多个子包packages ...
perf4j+spring+aop 配置注解方式
今天将perf4j基于spring aop方式进入了接入,接入方法还是比较简单.具体配置如下: logback.xml  <appender name= ...
django自带数据库sqlite
python manage.py makemigrations # 记录关于models.py的所有改动,但是还没有作用的数据库文件中 python manage.py migrate # 把mode ...
HDU-2802-F(N)
看到这题讨论版里有说用公式的有说用循环节的,但是个人觉得这两种方法都不靠谱,比赛场上做这种题能直接推出公式需要很强数学功底,而循环节的方法如果循环节比较大就不太好发现了.这种已知通项公式的题还是用矩阵 ...
吴裕雄--天生自然HTML学习笔记：HTML 链接
HTML 链接 HTML 使用超级链接与网络上的另一个文档相连.几乎可以在所有的网页中找到链接.点击链接可以从一张页面跳转到另一张页面. HTML 超链接(链接) HTML使用标签 <a> ...

5，Hadoop中的文件

5，Hadoop中的文件的更多相关文章

随机推荐

热门专题