1. hadoop环境搭建

1.1 伪分布式环境搭建

1.1.1 伪分布式环境搭建

1.1.2 伪分布式搭建结果

hdfs可视化界面: http://od001:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od001:8088/cluster

历史服务器可视化界面:http://od001:19888/

secondarynamenode可视化界面: http://od001:50090/status.html

1.1.3 批量启动脚本

#!/bin/bash
echo "启动namenode"
hadoop-daemon.sh start namenode
echo "启动datanode"
hadoop-daemon.sh start datanode
echo "启动resourcemanager"
yarn-daemon.sh start resourcemanager
echo "启动nodemanager"
yarn-daemon.sh start nodemanager
echo "启动historyserver"
mr-jobhistory-daemon.sh start historyserver
echo "启动secondarynamenode"
hadoop-daemon.sh start secondarynamenode

1.1.4 批量停止脚本

#!/bin/bash
echo "停止namenode"
hadoop-daemon.sh stop namenode
echo "停止datanode"
hadoop-daemon.sh stop datanode
echo "停止resourcemanager"
yarn-daemon.sh stop resourcemanager
echo "停止nodemanager"
yarn-daemon.sh stop nodemanager
echo "停止historyserver"
mr-jobhistory-daemon.sh stop historyserver
echo "停止secondarynamenode"
hadoop-daemon.sh stop secondarynamenode

1.2 集群环境

1.2.1 集群环境搭建

1)克隆虚拟机

2) 使用root用户修改网卡信息

vi /etc/udev/rules.d/70-persistent-net.rules

vi /etc/sysconfig/network-scripts/ifcfg-eth0

1.2.2 资源规划

  od002 od003 od004
HDFS      
  NameNode    
  DataNode DataNode DataNode
      SecondaryNameNode
YARN   ResourceManger  
  NodeManager NodeManager NodeManager
MapReduce      
  JobHistoryServer    
       

1.3.3 配置

hfds

  hadoop-env.sh

  core-site.xml

  hdfs-site.xml

  slaves

yarn

  yarn-env.sh

  yarn-site.xml

  slaves

mapreduce

  mapred-env.sh

  mapred-site.xml

1.3.4 配置同步

1)在od002、od003、od004分别使用ssh-keygen -t rsa命令,生成公私钥文件

2)在每台服务器的.ssh目录,使用

ssh-copy-id od002

ssh-copy-id od003

ssh-copy-id od004

配置ssh无密码登录

3)使用scp命令,同步配置文件

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od003:/opt/modules/hadoop-2.5.-cdh5.3.6

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od004:/opt/modules/hadoop-2.5.-cdh5.3.6

1.3.5 启动命令

1)在od002上,执行start-dfs.sh命令

Starting namenodes on [od002]
od002: starting namenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-namenode-od002.out
od004: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od004.out
od003: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od003.out
od002: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od002.out
Starting secondary namenodes [od004]
od004: starting secondarynamenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-secondarynamenode-od004.out

2)在od003上,执行start-yarn.sh命令

starting yarn daemons
starting resourcemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-resourcemanager-od003.out
od004: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od004.out
od002: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od002.out
od003: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od003.out

3)验证环境

yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.-cdh5.3.6.jar wordcount input output001

1.3.6 基准测试

1)基本测试:服务启动、是否可用、简单的应用

hdfs读写操作

2)

1.3.9 集群环境搭建结果

hdfs可视化界面: http://od002:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od003:8088/cluster

历史服务器可视化界面:http://od002:19888/

secondarynamenode可视化界面: http://od004:50090/status.html

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

  1. 【大数据系统架构师】0.2 Linux基础

    1. Linux基本环境 1.1 大数据Hadoop前置大纲讲解 1)Linux系统,基本命令 2)Java语言,JavaSE相关知识 3)MySQL基本的DML和DDL 1.2 常见Linux系统. ...

  2. 【大数据系统架构师】0.3 MySQL数据库

    1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...

  3. 【大数据系统架构师】0.1 Java编程基础

    1. 初识Java 2. Java语法 快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...

  4. App架构师实践指南三之基础组件

    App架构师实践指南三之基础组件 1.基础组件库随着时间的增长,代码量的逐渐积累,新旧项目之间有太多可以服用的代码.下面是整理的公共代码库. 2.关于加密密钥的保护以及网络传输安全是移动应用安全最关键 ...

  5. DKhadoop大数据系统架构设计方案

    大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了.如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉.大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我 ...

  6. .NET 云原生架构师训练营(模块二 基础巩固 EF Core 更新和迁移)--学习笔记

    2.4.6 EF Core -- 更新 状态 自动变更检测 不查询删除和更新 并发 状态 Entity State Property State Entity State Added 添加 Uncha ...

  7. FunData — 电竞大数据系统架构演进

    电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...

  8. 大数据基础Hadoop 2.x入门

    hadoop概述 存储和分析网络数据 三大组件 MapReduce 对海量数据的处理 思想: 分而治之 每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据 分布式存 ...

  9. .NET 云原生架构师训练营(模块二 基础巩固 敏捷开发)--学习笔记

    2.7.1 敏捷开发 敏捷介绍 敏捷的起源 敏捷软件开发宣言 敏捷开发十二原则 生命周期对比 敏捷开发的特点 敏捷的发展 敏捷的核心 敏捷的起源 2001年,17个老头子在一起一边滑雪,一边讨论工作, ...

随机推荐

  1. window下配置Solr6.5以及IK Analyzer分词配置

    一.安装准备及各软件使用版本说明: 1.下载jdk,我下载的版本是jdk-8u121-windows-x64.exe,下载地址: http://www.oracle.com/technetwork/j ...

  2. 解决word自动编号出现内容空格过大的问题

    选择你需要调整的段落.右键点击.选择“调整列表缩进” 然后在弹出的窗口中,第三行的“制表符”改成“空格”即可.或者空格都不需要可以改为“不特别标注”. 当编号超过10的时候,也会有空格太大的现象,这时 ...

  3. socket粘包现象加解决办法

    socket粘包现象分析与解决方案 简单远程执行命令程序开发(内容回顾) res = subprocess.Popen(cmd.decode('utf-8'),shell=True,stderr=su ...

  4. PCA主成分分析 ICA独立成分分析 LDA线性判别分析 SVD性质

    机器学习(8) -- 降维 核心思想:将数据沿方差最大方向投影,数据更易于区分 简而言之:PCA算法其表现形式是降维,同时也是一种特征融合算法. 对于正交属性空间(对2维空间即为直角坐标系)中的样本点 ...

  5. 01_java之基本语法

    01java语言概述 * A: java语言概述 * a: Java是sun公司开发的一门编程语言,目前被Oracle公司收购,编程语言就是用来编写软件的. * b: Java的应用 * 开发QQ.迅 ...

  6. django -- url 的 name 属性

    在html的form中使用给url定义的name值,可以在修改url时不用在修改form的src. urls.py from django.conf.urls import url from myte ...

  7. axis调用webservice客户端开发

    第一步:wsdl2Java.bat文件编写 Axis_Lib表示依赖的jar包路径 Output_Path表示生成的class路径 Package包名 还需要手动更改 -p %Package%表示we ...

  8. struts2结合axis开发webservice

    第一步:引入axis的依赖jar包  第二步:修改web.xml文件  <listener> <listener-class>org.apache.axis.transport ...

  9. 分析比较多表查询中的IN与JOIN

    IN 是子查询的关键字,JOIN 是连接的关键字,项目开发中经常会使用到多表查询,而子查询与连接正是实现多表查询的重要途径.那两者是怎么运行的?IN与JOIN哪个更好?下面就来分析与比较. 现在有te ...

  10. 20-从零玩转JavaWeb-Super关键字与子类初始化过程

    配套详解视频  super关键字 继承内存分析 this与super对比 继承字段隐藏 继承Object根类 一.Super关键字的作用 this:当前对象,谁调用this所在的方法,this就是哪一 ...