日志 --排错

.log:通过log4j记录的,记录大部分应用程序的日志信息
.out:记录标准输出和标准错误日志,少量记录
 
 

hdfs 常用shell

    -ls
    -put <localsrc> ... <dst>   上传
    -cat   -text   查看文件内容
    -mkdir [-p] 
    -mv
    -cp
    -du
    -chmod
 
 
认识一些重要的配置选项:
namenode 元数据??
datanode 数据存储目录 ?
 
系统默认:
文件名:core-default.xml、hdfs-default.xml、yarn-default.xml、mapred-default.xml
 
自定义的:
位置:$HADOOP_HOME/etc/hadoop
文件名:core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml
 
 
自定义namenode节点  datanode节点
hdfs-site.xml:
    <property>
<name>dfs.namenode.http-address</name>
<value>hadoop1:50070</value>
</property>
 
core-site.xml
    <property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.5.0/data</value>
</property>
 
yarn-site.xml

   <property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
 
 
日志聚合
    --日志上传到HDFS
 
yarn-site.xml
    <property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
 
 
    <property> 
      <name>yarn.log-aggregation.retain-seconds</name>
<value>86400</value>
</property>
 
 
mapred-site.xml
    <property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
 
启动服务
$ sbin/mr-jobhistory-daemon.sh start historyserver
 
 
目前:
 NameNode
Jps
DataNode
NodeManager
JobHistoryServer
ResourceManager
 
hdfs      --namenode   datanode
        --resourcemanager  nodemanager
 
namenode   
    --元数据(文件名、权限、时间)
        fsimage(内存)      二进制
            --> put rm mkdir -->edits
        edits_log  二进制
    -->重启
 
    -->hdfs有很多修改(元数据-->edits很大) replay
        -->下一次重启namenode,合并变得很慢
 
secondary namenode(不是热备)
        -->周期性合并fsimage和edits,辅助namenode
        -->通常安装到另外一台物理服务器
            --周期性:1H
            --edits:64M
 
hdfs-site.xml
    <property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop1:50090</value>
</property>
 
 
namenode       
    --HDFS的中心服务器
    --客户端访问HDFS集群的入口
    --响应给客户端的数据直接由datanode传出
    --读取文件时NameNode尽量让用户先读取最近的副本
    --周期性地从集群中的每个Datanode接收心跳信号和块状态报告(Blockreport)
 
datanode
    --存储数据
    --以块为单位进行存储(128M)
    --报告块的状态(1H)
    --周期性向namenode注册(3s)--(10min)
    --在线加入/卸载服务器
 
HDFS数据安全性??
 
safemode安全模式:  --HDFS
    --进入安全模式以后变成只读
    1、在namenode启动过程中
            -->datanode
    2、dfs.namenode.safemode.threshold-pct
            -->0.999f    -->block
 
 
HDFS   
    --存储大、动态扩展
    --运行在普通的商用服务器(容错高)
    --副本数、保证数据安全
    --一次写入、多次读写
    --不适合修改比较频繁的业务
    --适合存储大文件,不适合存储太多小文件
 
yarn  --资源管理
resourcemanager   
    --处理客户端请求
    --启动/监控ApplicationMaster
    --监控NodeManager
    --资源分配与调度
 
Application Master
    --作为job任务的管理者
    --为应用程序申请资源,并进一步分配给内部任务
    --任务监控与容错   
 
NodeManager
    --单个节点上的资源管理和任务管理
    --处理来自ResourceManager的命令
    --处理来自ApplicationMaster的命令
 
Container
    --对任务运行环境的抽象
    --描述一系列信息
    --任务运行资源(节点、内存、CPU)
    --任务启动命令
    --任务运行环境
 
 
yarn任务运行流程:
    1、resourcemanager收到客户端请求
    2、resourcemanager会去生产一个application master,作为当前job任务的管理者
    3、application master再去resource manager申请资源
    4、resource manager响应application master的资源申请
    5、application master分派任务给其他nodemanager(container)
    6、nodemanager接受到任务指派以后,开始执行job任务
    7、nodemanager执行完成以后向管理者报告
    8、application master向resourcemanager报告
 
 
yarn.nodemanager.resource.memory-mb  8G
yarn.nodemanager.resource.cpu-vcores
memory多少会影响任务执行是否失败
cpu只会job任务的快慢
 
 
 
 
 
 
 
 
 
 
 
 

2、HDFS和Yarn的基础学习笔记的更多相关文章

  1. 【C#编程基础学习笔记】4---Convert类型转换

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]4---Convert类型转换 ...

  2. 【C#编程基础学习笔记】6---变量的命名

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]6---变量的命名 ----- ...

  3. 1.C#基础学习笔记3---C#字符串(转义符和内存存储无关)

    技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com ------------------------------------- ...

  4. Java基础学习笔记总结

    Java基础学习笔记一 Java介绍 Java基础学习笔记二 Java基础语法之变量.数据类型 Java基础学习笔记三 Java基础语法之流程控制语句.循环 Java基础学习笔记四 Java基础语法之 ...

  5. Mysql数据库基础学习笔记

    Mysql数据库基础学习笔记 1.mysql查看当前登录的账户名以及数据库 一.单表查询 1.创建数据库yuzly,创建表fruits 创建表 ) ) ,) NOT NULL,PRIMARY KEY( ...

  6. 0003.5-20180422-自动化第四章-python基础学习笔记--脚本

    0003.5-20180422-自动化第四章-python基础学习笔记--脚本 1-shopping """ v = [ {"name": " ...

  7. Java基础学习笔记(一)

    Java基础学习笔记(一) Hello World 基础代码学习 代码编写基础结构 class :类,一个类即一个java代码,形成一个class文件,写于每个代码的前端(注意无大写字母) XxxYy ...

  8. C#RabbitMQ基础学习笔记

    RabbitMQ基础学习笔记(C#代码示例) 一.定义: MQ是MessageQueue,消息队列的简称(是流行的开源消息队列系统,利用erlang语言开发).MQ是一种应用程序对应用程序的通信方法. ...

  9. handlebars.js基础学习笔记

    最近在帮学校做个课程网站,就有人推荐用jquery+ajax+handlebars做网站前端,刚接触发现挺高大上的,于是就把一些基础学习笔记记录下来啦. 1.引用文件: jquery.js文件下载:h ...

随机推荐

  1. 高性能 Windows Socket 组件 HP-Socket v3.0.2 正式发布

    HP-Socket 是一套通用的高性能 Windows Socket 组件包,包含服务端组件(IOCP 模型)和客户端组件(Event Select 模型),广泛适用于 Windows 平台的 TCP ...

  2. php 相关模块备忘

    在安装php的时候,不管是编译安装: ./configure --prefix=/usr/local/php --with-config-file-path=/usr/local/php/etc -- ...

  3. MyEclipse之无法连接到MySQL数据库

    问题描述: 在连接mysql中出现如下警告 Fri Oct 28 02:21:53 CST 2016 WARN: Establishing SSL connection without server' ...

  4. Maven发布工程到公共库

    1.发布工程 新建一个 Maven build 选择要发布的工程

  5. 从零开始,做一个NodeJS博客(零):整体规(chui)划(niu)

    标签:NodeJS,Heroku 0 搭建一个个人独立博客,这是我好久之前就在计划的一件事了. 这个暑假,我学习了廖雪峰老师的NodeJS教程,又偶然在V2EX上发现了Heroku这个平台,可以免费在 ...

  6. CSS基础知识之文本属性二三事

    line-height 可以给某个元素指定一个不带单位的缩放因子,这样它的后代元素就会继承这个缩放因子,再根据自身的字号大小来计算自己的行高(line-height)值, body { font-si ...

  7. js判断空对象

    最近项目遇到判断空对象的一个问题,查阅相关资料再进行总结一下. 判断空对象不比判断空字符串之类的,因为空对象也是一个对象,需要单独分配内存,而不是像字符串那样为空时就是大锅饭,大家都相等,如下代码: ...

  8. c# 嵌入资源文件

    欢迎转载,转载请注明:转载自[ http://www.cnblogs.com/zjfree/ ] 开发环境:VS2005 C# 首先将要嵌入的资源拷贝到工程目录下. 设置文件生成操作为:嵌入的资源 获 ...

  9. SharePoint 2013 Silverlight中使用Net客户端对象模型

    1.创建Silverlight时,选择Silverlight 4,不要选择版本5,试了很久版本5都调用不了,自己也不知道什么原因,谷歌也没找到答案,后来尝试版本4,可以调用: 至于Host the S ...

  10. SharePoint 2013 中如何使用Silverlight

    1.打开VS,创建一个Silverlight程序,如下图: 2.配置选择默认的,当然也可以不勾选Host Application,如下图: 3.添加Silverlight控件,2个label和1个bu ...