1. hadoop环境搭建

1.1 伪分布式环境搭建

1.1.1 伪分布式环境搭建

1.1.2 伪分布式搭建结果

hdfs可视化界面: http://od001:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od001:8088/cluster

历史服务器可视化界面:http://od001:19888/

secondarynamenode可视化界面: http://od001:50090/status.html

1.1.3 批量启动脚本

#!/bin/bash
echo "启动namenode"
hadoop-daemon.sh start namenode
echo "启动datanode"
hadoop-daemon.sh start datanode
echo "启动resourcemanager"
yarn-daemon.sh start resourcemanager
echo "启动nodemanager"
yarn-daemon.sh start nodemanager
echo "启动historyserver"
mr-jobhistory-daemon.sh start historyserver
echo "启动secondarynamenode"
hadoop-daemon.sh start secondarynamenode

1.1.4 批量停止脚本

#!/bin/bash
echo "停止namenode"
hadoop-daemon.sh stop namenode
echo "停止datanode"
hadoop-daemon.sh stop datanode
echo "停止resourcemanager"
yarn-daemon.sh stop resourcemanager
echo "停止nodemanager"
yarn-daemon.sh stop nodemanager
echo "停止historyserver"
mr-jobhistory-daemon.sh stop historyserver
echo "停止secondarynamenode"
hadoop-daemon.sh stop secondarynamenode

1.2 集群环境

1.2.1 集群环境搭建

1)克隆虚拟机

2) 使用root用户修改网卡信息

vi /etc/udev/rules.d/70-persistent-net.rules

vi /etc/sysconfig/network-scripts/ifcfg-eth0

1.2.2 资源规划

  od002 od003 od004
HDFS      
  NameNode    
  DataNode DataNode DataNode
      SecondaryNameNode
YARN   ResourceManger  
  NodeManager NodeManager NodeManager
MapReduce      
  JobHistoryServer    
       

1.3.3 配置

hfds

  hadoop-env.sh

  core-site.xml

  hdfs-site.xml

  slaves

yarn

  yarn-env.sh

  yarn-site.xml

  slaves

mapreduce

  mapred-env.sh

  mapred-site.xml

1.3.4 配置同步

1)在od002、od003、od004分别使用ssh-keygen -t rsa命令,生成公私钥文件

2)在每台服务器的.ssh目录,使用

ssh-copy-id od002

ssh-copy-id od003

ssh-copy-id od004

配置ssh无密码登录

3)使用scp命令,同步配置文件

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od003:/opt/modules/hadoop-2.5.-cdh5.3.6

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od004:/opt/modules/hadoop-2.5.-cdh5.3.6

1.3.5 启动命令

1)在od002上,执行start-dfs.sh命令

Starting namenodes on [od002]
od002: starting namenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-namenode-od002.out
od004: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od004.out
od003: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od003.out
od002: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od002.out
Starting secondary namenodes [od004]
od004: starting secondarynamenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-secondarynamenode-od004.out

2)在od003上,执行start-yarn.sh命令

starting yarn daemons
starting resourcemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-resourcemanager-od003.out
od004: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od004.out
od002: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od002.out
od003: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od003.out

3)验证环境

yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.-cdh5.3.6.jar wordcount input output001

1.3.6 基准测试

1)基本测试:服务启动、是否可用、简单的应用

hdfs读写操作

2)

1.3.9 集群环境搭建结果

hdfs可视化界面: http://od002:50070/dfshealth.html#tab-overview

yarn可视化界面: http://od003:8088/cluster

历史服务器可视化界面:http://od002:19888/

secondarynamenode可视化界面: http://od004:50090/status.html

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

  1. 【大数据系统架构师】0.2 Linux基础

    1. Linux基本环境 1.1 大数据Hadoop前置大纲讲解 1)Linux系统,基本命令 2)Java语言,JavaSE相关知识 3)MySQL基本的DML和DDL 1.2 常见Linux系统. ...

  2. 【大数据系统架构师】0.3 MySQL数据库

    1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...

  3. 【大数据系统架构师】0.1 Java编程基础

    1. 初识Java 2. Java语法 快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...

  4. App架构师实践指南三之基础组件

    App架构师实践指南三之基础组件 1.基础组件库随着时间的增长,代码量的逐渐积累,新旧项目之间有太多可以服用的代码.下面是整理的公共代码库. 2.关于加密密钥的保护以及网络传输安全是移动应用安全最关键 ...

  5. DKhadoop大数据系统架构设计方案

    大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了.如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉.大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我 ...

  6. .NET 云原生架构师训练营(模块二 基础巩固 EF Core 更新和迁移)--学习笔记

    2.4.6 EF Core -- 更新 状态 自动变更检测 不查询删除和更新 并发 状态 Entity State Property State Entity State Added 添加 Uncha ...

  7. FunData — 电竞大数据系统架构演进

    电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...

  8. 大数据基础Hadoop 2.x入门

    hadoop概述 存储和分析网络数据 三大组件 MapReduce 对海量数据的处理 思想: 分而治之 每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据 分布式存 ...

  9. .NET 云原生架构师训练营(模块二 基础巩固 敏捷开发)--学习笔记

    2.7.1 敏捷开发 敏捷介绍 敏捷的起源 敏捷软件开发宣言 敏捷开发十二原则 生命周期对比 敏捷开发的特点 敏捷的发展 敏捷的核心 敏捷的起源 2001年,17个老头子在一起一边滑雪,一边讨论工作, ...

随机推荐

  1. js发送windows提示信息

    js发送windows提示信息 效果图 代码 Notification.requestPermission(function() { if(Notification.permission === 'g ...

  2. Python Twisted系列教程13:使用Deferred新功能实现新客户端

    作者:dave@http://krondo.com/deferred-all-the-way-down/  译者:杨晓伟(采用意译) 你可以从这里从头阅读这个系列. 介绍 回忆下第10部分中的客户端5 ...

  3. JavaScript之BON

    1.windows对象 全局作用域: 2.窗口关系及框架 如果页面包含框架,则每个框架都有自己的window对象,并且保存在iframes集合中,在iframe集合中,可以通过数值索引(从0开始,从左 ...

  4. 教你实现GPUImage - OpenGL渲染原理<转>

    http://www.open-open.com/lib/view/open1483943550976.html

  5. android获取mp4视频文件总时长和视频宽高<转>

    android使用 MediaMetadataRetriever 获取视频文件的 总时长 和视频的分辨率. 根据该方式获取视频信息可以看出不仅仅可以获取时长和分辨率,还能获取到其他的一些视频信息,不错 ...

  6. 视频x264编码浅析

    声明 x264_param_t 结构体变量: x264_param_t params; x264_param_default_preset(&params, "ultrafast&q ...

  7. PL/SQL查询设计器

    被微软惯坏的我,在使用PL/SQL进行oracle多表连接查询操作时候经常挠头. 今天无意间发现了PL/SQL也有查询设计器,虽然没有sqlserver的强大好用,但足够用了. 在菜单栏 工具---& ...

  8. python使用multiprocessing进行多进程编程(1)

    multiprocessing模块实现了对多进程编程的封装,让我们可以非常方便的使用多进程进行编程.它的使用方法非常类似threading模块. 1.创建一个进程 import multiproces ...

  9. C#中插入换行符

    要让一个Windows Form的TextBox显示多行文本就得把它的Multiline属性设置为true. 这个大家都知道,可是当你要在代码中为Text属性设置多行文本的时候可能会遇到点麻烦:) 你 ...

  10. jar包上传到jcenter

    H:\[BOOT]\gradle-5.0-bin\gradle-5.0\gradle.properties # in $HOME/.gradle/gradle.properties java6Home ...