日志 --排错

.log:通过log4j记录的,记录大部分应用程序的日志信息
.out:记录标准输出和标准错误日志,少量记录
 
 

hdfs 常用shell

    -ls
    -put <localsrc> ... <dst>   上传
    -cat   -text   查看文件内容
    -mkdir [-p] 
    -mv
    -cp
    -du
    -chmod
 
 
认识一些重要的配置选项:
namenode 元数据??
datanode 数据存储目录 ?
 
系统默认:
文件名:core-default.xml、hdfs-default.xml、yarn-default.xml、mapred-default.xml
 
自定义的:
位置:$HADOOP_HOME/etc/hadoop
文件名:core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml
 
 
自定义namenode节点  datanode节点
hdfs-site.xml:
    <property>
<name>dfs.namenode.http-address</name>
<value>hadoop1:50070</value>
</property>
 
core-site.xml
    <property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.5.0/data</value>
</property>
 
yarn-site.xml

   <property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
 
 
日志聚合
    --日志上传到HDFS
 
yarn-site.xml
    <property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
 
 
    <property> 
      <name>yarn.log-aggregation.retain-seconds</name>
<value>86400</value>
</property>
 
 
mapred-site.xml
    <property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
 
启动服务
$ sbin/mr-jobhistory-daemon.sh start historyserver
 
 
目前:
 NameNode
Jps
DataNode
NodeManager
JobHistoryServer
ResourceManager
 
hdfs      --namenode   datanode
        --resourcemanager  nodemanager
 
namenode   
    --元数据(文件名、权限、时间)
        fsimage(内存)      二进制
            --> put rm mkdir -->edits
        edits_log  二进制
    -->重启
 
    -->hdfs有很多修改(元数据-->edits很大) replay
        -->下一次重启namenode,合并变得很慢
 
secondary namenode(不是热备)
        -->周期性合并fsimage和edits,辅助namenode
        -->通常安装到另外一台物理服务器
            --周期性:1H
            --edits:64M
 
hdfs-site.xml
    <property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop1:50090</value>
</property>
 
 
namenode       
    --HDFS的中心服务器
    --客户端访问HDFS集群的入口
    --响应给客户端的数据直接由datanode传出
    --读取文件时NameNode尽量让用户先读取最近的副本
    --周期性地从集群中的每个Datanode接收心跳信号和块状态报告(Blockreport)
 
datanode
    --存储数据
    --以块为单位进行存储(128M)
    --报告块的状态(1H)
    --周期性向namenode注册(3s)--(10min)
    --在线加入/卸载服务器
 
HDFS数据安全性??
 
safemode安全模式:  --HDFS
    --进入安全模式以后变成只读
    1、在namenode启动过程中
            -->datanode
    2、dfs.namenode.safemode.threshold-pct
            -->0.999f    -->block
 
 
HDFS   
    --存储大、动态扩展
    --运行在普通的商用服务器(容错高)
    --副本数、保证数据安全
    --一次写入、多次读写
    --不适合修改比较频繁的业务
    --适合存储大文件,不适合存储太多小文件
 
yarn  --资源管理
resourcemanager   
    --处理客户端请求
    --启动/监控ApplicationMaster
    --监控NodeManager
    --资源分配与调度
 
Application Master
    --作为job任务的管理者
    --为应用程序申请资源,并进一步分配给内部任务
    --任务监控与容错   
 
NodeManager
    --单个节点上的资源管理和任务管理
    --处理来自ResourceManager的命令
    --处理来自ApplicationMaster的命令
 
Container
    --对任务运行环境的抽象
    --描述一系列信息
    --任务运行资源(节点、内存、CPU)
    --任务启动命令
    --任务运行环境
 
 
yarn任务运行流程:
    1、resourcemanager收到客户端请求
    2、resourcemanager会去生产一个application master,作为当前job任务的管理者
    3、application master再去resource manager申请资源
    4、resource manager响应application master的资源申请
    5、application master分派任务给其他nodemanager(container)
    6、nodemanager接受到任务指派以后,开始执行job任务
    7、nodemanager执行完成以后向管理者报告
    8、application master向resourcemanager报告
 
 
yarn.nodemanager.resource.memory-mb  8G
yarn.nodemanager.resource.cpu-vcores
memory多少会影响任务执行是否失败
cpu只会job任务的快慢
 
 
 
 
 
 
 
 
 
 
 
 

2、HDFS和Yarn的基础学习笔记的更多相关文章

  1. 【C#编程基础学习笔记】4---Convert类型转换

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]4---Convert类型转换 ...

  2. 【C#编程基础学习笔记】6---变量的命名

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]6---变量的命名 ----- ...

  3. 1.C#基础学习笔记3---C#字符串(转义符和内存存储无关)

    技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com ------------------------------------- ...

  4. Java基础学习笔记总结

    Java基础学习笔记一 Java介绍 Java基础学习笔记二 Java基础语法之变量.数据类型 Java基础学习笔记三 Java基础语法之流程控制语句.循环 Java基础学习笔记四 Java基础语法之 ...

  5. Mysql数据库基础学习笔记

    Mysql数据库基础学习笔记 1.mysql查看当前登录的账户名以及数据库 一.单表查询 1.创建数据库yuzly,创建表fruits 创建表 ) ) ,) NOT NULL,PRIMARY KEY( ...

  6. 0003.5-20180422-自动化第四章-python基础学习笔记--脚本

    0003.5-20180422-自动化第四章-python基础学习笔记--脚本 1-shopping """ v = [ {"name": " ...

  7. Java基础学习笔记(一)

    Java基础学习笔记(一) Hello World 基础代码学习 代码编写基础结构 class :类,一个类即一个java代码,形成一个class文件,写于每个代码的前端(注意无大写字母) XxxYy ...

  8. C#RabbitMQ基础学习笔记

    RabbitMQ基础学习笔记(C#代码示例) 一.定义: MQ是MessageQueue,消息队列的简称(是流行的开源消息队列系统,利用erlang语言开发).MQ是一种应用程序对应用程序的通信方法. ...

  9. handlebars.js基础学习笔记

    最近在帮学校做个课程网站,就有人推荐用jquery+ajax+handlebars做网站前端,刚接触发现挺高大上的,于是就把一些基础学习笔记记录下来啦. 1.引用文件: jquery.js文件下载:h ...

随机推荐

  1. 项目总结笔记系列 Maven Session1

    主题:Maven 参考地址: 1.http://www.yiibai.com/maven/ 2.http://www.icoolxue.com/ 目录 1.环境搭建 2.pom.xml文件解析 3.m ...

  2. Struct2

    1.MVC思想概述 Servlet作为前端控制器,负责接收客户端发送的请求,在Servlet中只包含控制逻辑和简单的前端处理:然后调用后端javabean来完成实际的逻辑处理: 最后转发到相应的jsp ...

  3. python django 多级业务树形结构规划及页面渲染

    概述: 在项目中,父级到子级结构并不少见,如果仅仅的两层树形结构,我们可以使用数据库的外键设计轻松做到,子级业务表设计一字段外键到父级业务表,这样子到父.父到子的查询都非常简单. 但是往往父子结构会有 ...

  4. CI框架源码阅读笔记2 一切的入口 index.php

    上一节(CI框架源码阅读笔记1 - 环境准备.基本术语和框架流程)中,我们提到了CI框架的基本流程,这里再次贴出流程图,以备参考: 作为CI框架的入口文件,源码阅读,自然由此开始.在源码阅读的过程中, ...

  5. 剖析信用卡 DCC 交易

    摘要: 所谓DCC交易(Dynamic Currency Conversion,直译:动态货币转换 ),或者叫CPC交易(Cardholder Preferred Currency,直译:持卡人选定货 ...

  6. GJM : FlatBuffers 与 protobuf 性能比较 [转载 ]

    原帖地址:http://blog.csdn.net/menggucaoyuan/article/details/34409433 原作者:企鹅  menggucaoyuan 未经原作者同意不允许转载 ...

  7. Jquery UI 和Easy UI常用插件

    一.Jquery的插件简介 (一)什么是插件 插件(Plug-in)是一种遵循一定的应用程序接口规范编写出来的程序,是原有系统平台或应用软件平台功能的一种扩展和补充. 注意!!其只能在程序规定的系统平 ...

  8. Glide.js:响应式 & 触摸友好的 jQuery 滑块插件

    Glide.js 是一款响应式和对触摸友好的 jQuery 滑块.基于 CSS3 转换实现,并在低版本浏览器降级处理.Glide.js 简单,重量轻,快速,适用于智能手机,平板电脑和台式机.它支持 s ...

  9. Sublime Text3 支持Less

    1.安装Sublime 插件 (1)安装LESS插件:因为Sublime不支持Less语法高亮,所以,先安装这个插件,方法: ctrl+shift+p>install Package>输入 ...

  10. animate 实现滑动切换效果

    今天和大家分享一下用 animate 实现滑动切换效果的小例子 ------- 来自<一只有梦想的前端小白> 大家都知道jQuery 提供的有一下几种方法能够实现滑动效果: slideDo ...