【大数据系统架构师】1.2 大数据基础Hadoop 2.X

1. hadoop环境搭建

1.1 伪分布式环境搭建

1.1.1 伪分布式环境搭建

1.1.2 伪分布式搭建结果

hdfs可视化界面： http://od001:50070/dfshealth.html#tab-overview

yarn可视化界面： http://od001:8088/cluster

历史服务器可视化界面：http://od001:19888/

secondarynamenode可视化界面： http://od001:50090/status.html

1.1.3 批量启动脚本

#!/bin/bash

echo "启动namenode"

hadoop-daemon.sh start namenode

echo "启动datanode"

hadoop-daemon.sh start datanode

echo "启动resourcemanager"

yarn-daemon.sh start resourcemanager

echo "启动nodemanager"

yarn-daemon.sh start nodemanager

echo "启动historyserver"

mr-jobhistory-daemon.sh start historyserver

echo "启动secondarynamenode"

hadoop-daemon.sh start secondarynamenode

1.1.4 批量停止脚本

#!/bin/bash

echo "停止namenode"

hadoop-daemon.sh stop namenode

echo "停止datanode"

hadoop-daemon.sh stop datanode

echo "停止resourcemanager"

yarn-daemon.sh stop resourcemanager

echo "停止nodemanager"

yarn-daemon.sh stop nodemanager

echo "停止historyserver"

mr-jobhistory-daemon.sh stop historyserver

echo "停止secondarynamenode"

hadoop-daemon.sh stop secondarynamenode

1.2 集群环境

1.2.1 集群环境搭建

1）克隆虚拟机

2）使用root用户修改网卡信息

vi /etc/udev/rules.d/70-persistent-net.rules

vi /etc/sysconfig/network-scripts/ifcfg-eth0

1.2.2 资源规划

	od002	od003	od004
HDFS
	NameNode
	DataNode	DataNode	DataNode
			SecondaryNameNode
YARN		ResourceManger
	NodeManager	NodeManager	NodeManager
MapReduce
	JobHistoryServer

1.3.3 配置

hfds

　　hadoop-env.sh

　　core-site.xml

　　hdfs-site.xml

　　slaves

yarn

　　yarn-env.sh

　　yarn-site.xml

　　slaves

mapreduce

　　mapred-env.sh

　　mapred-site.xml

1.3.4 配置同步

1）在od002、od003、od004分别使用ssh-keygen -t rsa命令，生成公私钥文件

2）在每台服务器的.ssh目录，使用

ssh-copy-id od002

ssh-copy-id od003

ssh-copy-id od004

配置ssh无密码登录

3）使用scp命令，同步配置文件

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od003:/opt/modules/hadoop-2.5.-cdh5.3.6

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od004:/opt/modules/hadoop-2.5.-cdh5.3.6

1.3.5 启动命令

1）在od002上，执行start-dfs.sh命令

Starting namenodes on [od002]

od002: starting namenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-namenode-od002.out

od004: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od004.out

od003: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od003.out

od002: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od002.out

Starting secondary namenodes [od004]

od004: starting secondarynamenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-secondarynamenode-od004.out

2）在od003上，执行start-yarn.sh命令

starting yarn daemons

starting resourcemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-resourcemanager-od003.out

od004: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od004.out

od002: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od002.out

od003: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od003.out

3）验证环境

yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.-cdh5.3.6.jar wordcount input output001

1.3.6 基准测试

1）基本测试：服务启动、是否可用、简单的应用

hdfs读写操作

2）

1.3.9 集群环境搭建结果

hdfs可视化界面： http://od002:50070/dfshealth.html#tab-overview

yarn可视化界面： http://od003:8088/cluster

历史服务器可视化界面：http://od002:19888/

secondarynamenode可视化界面： http://od004:50090/status.html

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

【大数据系统架构师】0.2 Linux基础
1. Linux基本环境 1.1 大数据Hadoop前置大纲讲解 1)Linux系统,基本命令 2)Java语言,JavaSE相关知识 3)MySQL基本的DML和DDL 1.2 常见Linux系统. ...
【大数据系统架构师】0.3 MySQL数据库
1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...
【大数据系统架构师】0.1 Java编程基础
1. 初识Java 2. Java语法快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...
App架构师实践指南三之基础组件
App架构师实践指南三之基础组件 1.基础组件库随着时间的增长,代码量的逐渐积累,新旧项目之间有太多可以服用的代码.下面是整理的公共代码库. 2.关于加密密钥的保护以及网络传输安全是移动应用安全最关键 ...
DKhadoop大数据系统架构设计方案
大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了.如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉.大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我 ...
.NET 云原生架构师训练营（模块二基础巩固 EF Core 更新和迁移）--学习笔记
2.4.6 EF Core -- 更新状态自动变更检测不查询删除和更新并发状态 Entity State Property State Entity State Added 添加 Uncha ...
FunData — 电竞大数据系统架构演进
电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...
大数据基础Hadoop 2.x入门
hadoop概述存储和分析网络数据三大组件 MapReduce 对海量数据的处理思想: 分而治之每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据分布式存 ...
.NET 云原生架构师训练营（模块二基础巩固敏捷开发）--学习笔记
2.7.1 敏捷开发敏捷介绍敏捷的起源敏捷软件开发宣言敏捷开发十二原则生命周期对比敏捷开发的特点敏捷的发展敏捷的核心敏捷的起源 2001年,17个老头子在一起一边滑雪,一边讨论工作, ...

随机推荐

jQuery UI Draggable + Sortable 结合使用
工作中需要将一个左边的设计好的控件,拖拽到右边的面板中,同时保持右边面板中的控件自由排序,这时候就需要及支持拖拽又支持排序的操作了, Demo截图:从左边控件拖到右边区域代码段: <scrip ...
mybatis~SQL映射
student.xml里面是这么写的: <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE m ...
rpm --import /etc/pki/rpm-gpg/RPM* 有什么用？
今天用yum安装软件,遇到了Could not open/read file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL问题,为了加深印象,特别搜索了RPM-GPG-K ...
Linux性能监测：磁盘IO篇
磁盘通常是计算机最慢的子系统,也是最容易出现性能瓶颈的地方,因为磁盘离 CPU 距离最远而且 CPU 访问磁盘要涉及到机械操作,比如转轴.寻轨等.访问硬盘和访问内存之间的速度差别是以数量级来计算的,就 ...
nginx反向代理负载均衡初次配置
反向代理,我个人理解是通过一台反向代理服务器,把客户端的把有请求按照一定的规则分发给后台的服务器.nginx作反向代理服务器的虚拟机配置如下: upstream itest { #正常情况下应该作如下 ...
ARM六种寻址方式的汇编实现
AREA Example,CODE,READONLY ENTRY CODE32 ;S 后缀:更新标志位CPSR ;!后缀:基址寄存器中的地址发生变化 ;LDR 从存储器中加载数据到寄存器 ;STR 从 ...
c++builder 编译独立运行
cb6 XE7 Project>Options> Packages>Runtime Packages>Link with runtime packags勾去掉.c++ Link ...
SpringMVC总结四：拦截器简单介绍
首先要说一下HandlerExecutionChain: HandlerExecutionChain是一个执行链,当用户的请求到达DispatcherServlet的时候,DispatcherServ ...
IIS设置Access-Control-Allow-Origin
打开iis,找到“HTTP响应标头”点进去, 在右侧可以看到添加,然后添加如下标头即可Access-Control-Allow-Headers:Content-Type, api_key, Autho ...
使用Fuel安装openstack
一.前言 Fuel是OpenStack的开源部署和管理工具.作为OpenStack社区的开发贡献者,它为OpenStack.OpenStack相关社区项目以及OpenStack插件的部署和管理提供了直 ...

【大数据系统架构师】1.2 大数据基础Hadoop 2.X

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

随机推荐

热门专题