1. hadoop环境搭建

1.1 伪分布式环境搭建

1.1.1 伪分布式环境搭建

1.1.2 伪分布式搭建结果

hdfs可视化界面: http://od001:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od001:8088/cluster

历史服务器可视化界面:http://od001:19888/

secondarynamenode可视化界面: http://od001:50090/status.html

1.1.3 批量启动脚本

#!/bin/bash
echo "启动namenode"
hadoop-daemon.sh start namenode
echo "启动datanode"
hadoop-daemon.sh start datanode
echo "启动resourcemanager"
yarn-daemon.sh start resourcemanager
echo "启动nodemanager"
yarn-daemon.sh start nodemanager
echo "启动historyserver"
mr-jobhistory-daemon.sh start historyserver
echo "启动secondarynamenode"
hadoop-daemon.sh start secondarynamenode

1.1.4 批量停止脚本

#!/bin/bash
echo "停止namenode"
hadoop-daemon.sh stop namenode
echo "停止datanode"
hadoop-daemon.sh stop datanode
echo "停止resourcemanager"
yarn-daemon.sh stop resourcemanager
echo "停止nodemanager"
yarn-daemon.sh stop nodemanager
echo "停止historyserver"
mr-jobhistory-daemon.sh stop historyserver
echo "停止secondarynamenode"
hadoop-daemon.sh stop secondarynamenode

1.2 集群环境

1.2.1 集群环境搭建

1)克隆虚拟机

2) 使用root用户修改网卡信息

vi /etc/udev/rules.d/70-persistent-net.rules

vi /etc/sysconfig/network-scripts/ifcfg-eth0

1.2.2 资源规划

  od002 od003 od004
HDFS      
  NameNode    
  DataNode DataNode DataNode
      SecondaryNameNode
YARN   ResourceManger  
  NodeManager NodeManager NodeManager
MapReduce      
  JobHistoryServer    
       

1.3.3 配置

hfds

  hadoop-env.sh

  core-site.xml

  hdfs-site.xml

  slaves

yarn

  yarn-env.sh

  yarn-site.xml

  slaves

mapreduce

  mapred-env.sh

  mapred-site.xml

1.3.4 配置同步

1)在od002、od003、od004分别使用ssh-keygen -t rsa命令,生成公私钥文件

2)在每台服务器的.ssh目录,使用

ssh-copy-id od002

ssh-copy-id od003

ssh-copy-id od004

配置ssh无密码登录

3)使用scp命令,同步配置文件

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od003:/opt/modules/hadoop-2.5.-cdh5.3.6

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od004:/opt/modules/hadoop-2.5.-cdh5.3.6

1.3.5 启动命令

1)在od002上,执行start-dfs.sh命令

Starting namenodes on [od002]
od002: starting namenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-namenode-od002.out
od004: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od004.out
od003: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od003.out
od002: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od002.out
Starting secondary namenodes [od004]
od004: starting secondarynamenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-secondarynamenode-od004.out

2)在od003上,执行start-yarn.sh命令

starting yarn daemons
starting resourcemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-resourcemanager-od003.out
od004: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od004.out
od002: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od002.out
od003: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od003.out

3)验证环境

yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.-cdh5.3.6.jar wordcount input output001

1.3.6 基准测试

1)基本测试:服务启动、是否可用、简单的应用

hdfs读写操作

2)

1.3.9 集群环境搭建结果

hdfs可视化界面: http://od002:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od003:8088/cluster

历史服务器可视化界面:http://od002:19888/

secondarynamenode可视化界面: http://od004:50090/status.html

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

  1. 【大数据系统架构师】0.2 Linux基础

    1. Linux基本环境 1.1 大数据Hadoop前置大纲讲解 1)Linux系统,基本命令 2)Java语言,JavaSE相关知识 3)MySQL基本的DML和DDL 1.2 常见Linux系统. ...

  2. 【大数据系统架构师】0.3 MySQL数据库

    1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...

  3. 【大数据系统架构师】0.1 Java编程基础

    1. 初识Java 2. Java语法 快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...

  4. App架构师实践指南三之基础组件

    App架构师实践指南三之基础组件 1.基础组件库随着时间的增长,代码量的逐渐积累,新旧项目之间有太多可以服用的代码.下面是整理的公共代码库. 2.关于加密密钥的保护以及网络传输安全是移动应用安全最关键 ...

  5. DKhadoop大数据系统架构设计方案

    大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了.如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉.大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我 ...

  6. .NET 云原生架构师训练营(模块二 基础巩固 EF Core 更新和迁移)--学习笔记

    2.4.6 EF Core -- 更新 状态 自动变更检测 不查询删除和更新 并发 状态 Entity State Property State Entity State Added 添加 Uncha ...

  7. FunData — 电竞大数据系统架构演进

    电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...

  8. 大数据基础Hadoop 2.x入门

    hadoop概述 存储和分析网络数据 三大组件 MapReduce 对海量数据的处理 思想: 分而治之 每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据 分布式存 ...

  9. .NET 云原生架构师训练营(模块二 基础巩固 敏捷开发)--学习笔记

    2.7.1 敏捷开发 敏捷介绍 敏捷的起源 敏捷软件开发宣言 敏捷开发十二原则 生命周期对比 敏捷开发的特点 敏捷的发展 敏捷的核心 敏捷的起源 2001年,17个老头子在一起一边滑雪,一边讨论工作, ...

随机推荐

  1. 关系数据库元组关系演算语言ALPHA

    关系演算 :以数理逻辑中的谓词演算为基础 按谓词变元不同分类 1.元组关系演算:以元组变量作为谓词变元的基本对象元组关系演算语言ALPHA2.域关系演算:以域变量作为谓词变元的基本对象域关系演算语言Q ...

  2. maven(基础介绍一)

    maven:提供的作用有以下几点: 1 jar包依赖 这个也许会maven最突出的特点了使用maven不需要上网单独下载jar包,只需要在配置文件pom.xml中配置jar包的依赖关系,就可以自动的下 ...

  3. STM32用有源蜂鸣器实现闹钟的声响

    有源蜂鸣器的声音是固定的,工作电压恒定,改变通断电的时间获得不同时长的音响,譬如连续音.快速短音.慢速长音(类似莫尔斯电报)来区分不同的报警信息. 简单的说,有源蜂鸣器只能发出一种声音,因为它的频率是 ...

  4. python学习——练习题(4)

    """ 题目:输入某年某月某日,判断这一天是这一年的第几天? """ import datetime import time from fu ...

  5. scala中存在的问题

    2017-12-27 scala学习中存在的问题: 1.表达式的概念要搞清楚 2.八种基本数据类型要搞清楚 Byte\Short\Int\Long\Char\Boolean\Double\Float都 ...

  6. random和os模块

    一.random模块 常用方法如下: #-*- coding:utf-8 -*- import random print(random.randint(1,100)) # 获取一个范围内的随机数,包含 ...

  7. PyCharm设置Ipython交互环境和宏快捷键进行数据分析图文详解

    使用Python进行数据分析,大家都会多少学习一本经典教材<利用Python进行数据分析>,书中作者使用了Ipython的交互环境进行了书中所有代码的案例演示,而书中的Ipython交互环 ...

  8. UIAtlas

    [UIAtlas] UIAtlas is a container that has coordinate information for a bunch of sprites. AtlasType有2 ...

  9. Professional C# 6 and .NET Core 1.0 - Creating Hello, World! with Visual Studio

    本文为转载,学习研究 Creating Hello, World! with Visual Studio Chapter 1, “.NET Application Architectures,” ex ...

  10. laravel 验证表单信息

    1控制器验证 $this->validate($request,[ 'Student.name'=>'required|min:2|max:20', 'Student.age'=>' ...