BG.Hadoop.Master

1. 安装JDK

　　JDK安装包复制到/opt文件夹

　　cd /opt

　　rpm -ivh jdk-8u121-linux-x64.rpm

　　vim /etc/profile

　　增加 JAVA_HOME=/usr/java/default

　　PATH=$JAVA_HOME/bin:$PATH

　　source /etc/profile

　　验证 echo $JAVA_HOME

　　java -version

2. 配置SSH（免密码登录）,Hadoop集群间登录使用。

　　a> 在客户端进行如下操作：

　　　　ssh-keygen -t rsa　　生成密钥

　　　　cat id_rsa.pub >> authorized_keys　　客户端注册公钥

　　　　cat id_rsa.pub | ssh root@bigdata.mysql "cat - >> ~/.ssh/authorized_keys"　　注册公钥到服务器

　　b> 在服务器段进行：　　

　　　　chmod 700 -R .ssh

　　　　chmod 600 .ssh/authorized_keys

　　或者：在客户端直接 ssh-copy-id ~/.ssh/id_rsa.pub root@bigdata.mysql

　　c> 测试

　　　　在客户端：ssh bigdata.mysql

3. Hadoop集群搭建-Master

　　tar zxf hadoop-2.7.3.tar.gz

　　vim /etc/profile

　　增加 HADOOP_HOME=/opt/hadoop-2.7.3

　　PATH增加$HADOOP_HOME/bin:段

　　source /etc/profile

　　检查 echo $HADOOP_HOME

　　cd /opt/hadoop-2.7.3/etc/hadoop/

　　配置：core-site.xml; hdfs-site.xml; yarn-site.xml; mapred-site.xml; slaves

　　core-site.xml

<property>

    <name>fs.default.name</name>

    <value>hdfs://bigdata.hadoop.master:9000</value>

  </property>

  <property>

    <name>hadoop.tmp.dir</name>

    <value>/opt/hadoop-2.7.3/current/tmp</value>

  </property>

  <property>

    <name>fs.trash.interval</name>

    <value>4320</value>

  </property>

　　mkdir -p /opt/hadoop-2.7.3/current/tmp

　　hdfs-site.xml

<property>

    <name>dfs.namenode.name.dir</name>

    <value>/opt/hadoop-2.7.3/current/data</value>

  </property>

  <property>

    <name>dfs.namenode.name.dir</name>

    <value>/opt/hadoop-2.7.3/current/name</value>

  </property>

  <property>

    <name>dfs.datanode.data.dir</name>

    <value>/opt/hadoop-2.7.3/current/data</value>

  </property>

  <property>

    <name>dfs.replication</name>

    <value>3</value>

  </property>

  <property>

    <name>dfs.webhdfs.enabled</name>

    <value>true</value>

  </property>

  <property>

    <name>dfs.permission.superusergroup</name>

    <value>staff</value>

  </property>

  <property>

    <name>dfs.permission.enabled</name>

    <value>false</value>

  </property>

　　mkdir -p /opt/hadoop-2.7.3/current/name

　　mkdir -p /opt/hadoop-2.7.3/current/data

　　yarn-site.xml

<property>

    <name>yarn.resourcemanager.hostname</name>

    <value>bigdata.hadoop.master</value>

  </property>

  <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

  </property>

  <property>

    <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

    <value>org.apache.hadoop.mapred.ShuffleHandler</value>

  </property>

  <property>

    <name>yarn.resourcemanager.address</name>

    <value>bigdata.hadoop.master:18040</value>

  </property>

  <property>

    <name>yarn.resourcemanager.scheduler.address</name>

    <value>bigdata.haddop.master:18030</value>

  </property>

  <property>

    <name>yarn.resourcemanager.resource-tracker.address</name>

    <value>bigdata.hadoop.master:18025</value>

  </property>

  <property>

    <name>yarn.resource.manager.admin.address</name>

    <value>bigdata.hadoop.master:18141</value>

  </property>

  <property>

    <name>yarn.resourcemanager.webapp.address</name>

    <value>bigdata.hadoop.master:18088</value>

  </property>

  <property>

    <name>yarn.log-aggregation-enable</name>

    <value>true</value>

  </property>

  <property>

    <name>yarn.log-aggregation.retain-seconds</name>

    <value>86400</value>

  </property>

  <property>

    <name>yarn.log-aggregation.retain-check-interval-seconds</name>

    <value>86400</value>

  </property>

  <property>

    <name>yarn.nodemanager.remote-app-log-dir</name>

    <value>/tmp/logs</value>

  </property>

  <property>

    <name>yarn.nodemanager.remote-app-log-dir-suffix</name>

    <value>logs</value>

  </property>

　　mapred-site.xml

　　cp mapred-site.xml.template mapred-site.xml

　　vim mapred-site.xml

 <property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

  </property>

  <property>

    <name>mapreduce.jobtracker.http.address</name>

    <value>bigdata.hadoop.master:50030</value>

  </property>

  <property>

    <name>mapreduce.jobhistory.address</name>

    <value>bigdata.hadoop.master:10020</value>

  </property>

  <property>

    <name>mapreduce.jobhistory.webapp.address</name>

    <value>bigdata.hadoop.master:19888</value>

  </property>

  <property>

    <name>mapreduce.jobhistory.done-dir</name>

    <value>/jobhistory/done</value>

  </property>

  <property>

    <name>mapreduce.intermediate-done-dir</name>

    <value>/jobhistory/done_intermediate</value>

  </propery>

  <property>

    <name>mapreduce.job.ubertask.enable</name>

    <value>true</value>

  </property>

　　slaves

　　bigdata.hadoop.master

　　bigdata.hadoop.slave1

　　bigdata.hadoop.slave2

　　bigdata.hadoop.slave3

　　vim /opt/hadoop-2.7.3/etc/hadoop/hadoop-env.sh

　　export JAVA_HOME=/usr/java/default

4. 创建Slaves虚拟机

　 bigdata.hadoop.slave1

　　bigdata.hadoop.slave2

　　bigdata.hadoop.slave3

5. SSH免密码登录

　　在bigdata.hadoop.master上执行：

　　ssh-keygen -t rsa　　--生成密钥公钥，一路回车

　　ssh-copy-id -i ~/.ssh/id_rsa.pub root@bigdata.hadoop.slave1

　　ssh-copy-id -i ~/.ssh/id_rsa.pub root@bigdata.hadoop.slave2

　　cat ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

　　测试免密码登录

　　ssh bigdata.hadoop.slave1, ssh bigdata.hadoop.slave2, ssh bigdata.hadoop.slave3, ssh bigdata.hadoop.master

6. 关闭防火墙和SELIXNUX

　　service iptables stop　　--临时关闭防火墙

　　chkconfig iptables off　　--永久关闭

　　chkconfig --list|grep iptables

　　vi /etc/sysconfig/selinux

　　SELINUX=disabled

　　setenforce 0

　　getenforce

7. Copy文件到虚拟机

　　安装scp命令：yum install openssh-clients

　　scp -r /opt/hadoop-2.7.3 root@bigdata.hadoop.slave1:/opt/

　　配置Slaves的etc/profile

8. 格式化Hadoop

　　在Master上执行： hdfs namenode -format

9. 启动Hadoop

　　在Master上执行：/opt/hadoop-2.7.3/sbi/start-all.sh

10. 查看Hadoop状态

　　在Master执行：JPS

　　　　NodeManager; NameNode; SecondaryNameNode; ResourceManager; DataNode

　　在Slaves上执行：JPS

　　　　NodeManager; DataNode;

　　在外部访问：http://bigdata.hadoop.master:50070 和 http://bigdata.hadoop.master:18088

　　打开ServiceHistoryServer

　　/opt/hadoop-2.7.3/sbin/mr-jobhistory-daemon.sh start historyserver

　　在外部访问：http://bigdata.hadoop.master:19888

11. 执行Map-Reduce任务

　　词频统计

　　1. 将1个txt文本上传到hdfs

　　　　hdfs dfs -put testfile.txt /task1/input/testfile

　　2. 执行Map-Reduce任务

　　　　hadoop jar /opt/hadoop-2.7.3/share/hadoop/mareduce/hadoop-mapreduce-examples-2.7.3 jar wordcound /task1/input/testfile /task1/output

　　3. 查看输出结果

　　　　hdfs dfs -cat /task1/output/part-r-00000

BG.Hadoop.Master的更多相关文章

Hadoop,master和slave简单的分布式搭建
搭建过程中配置免密钥登录为了以后方便使用 [提醒]安装Hadoop中会遇到新建文件夹,配置路径等问题,这个不能生搬硬套,要使用自己配置的路径,灵活使用. Hadoop的部署配置文件在http://bl ...
Hadoop分布式系统的安装部署
1.关于虚拟机的复制新建一台虚拟机,系统为CentOS7,再克隆两台,组成一个三台机器的小集群.正常情况下一般需要五台机器(一个Name节点,一个SecondName节点,三个Data节点.) 此外 ...
安装hadoop+zookeeper ha
安装hadoop+zookeeper ha 前期工作配置好网络和主机名和关闭防火墙 chkconfig iptables off //关闭防火墙 1.安装好java并配置好相关变量 (/etc/pro ...
Hadoop学习笔记—6.Hadoop Eclipse插件的使用
开篇:Hadoop是一个强大的并行软件开发框架,它可以让任务在分布式集群上并行处理,从而提高执行效率.但是,它也有一些缺点,如编码.调试Hadoop程序的难度较大,这样的缺点直接导致开发人员入门门槛高 ...
HADOOP安装指南-Ubuntu15.10和hadoop2.7.2
Ubuntu15.10中安装hadoop2.7.2安装手册太初目录 1. Hadoop单点模式... 2 1.1 安装步骤... 2 0.环境和版本... 2 1.在ubu ...
大数据系列（4）——Hadoop集群VSFTP和SecureCRT安装配置
前言经过前三篇文章的介绍,已经通过VMware安装了Hadoop的集群环境,当然,我相信安装的过程肯定遇到或多或少的问题,这些都需要自己解决,解决的过程就是学习的过程,本篇的来介绍几个Hadoop环 ...
hadoop伪分布式平台搭建（centos 6.3）
最近要写一个数据量较大的程序,所以想搭建一个hbase平台试试.搭建hbase伪分布式平台,需要先搭建hadoop平台.本文主要介绍伪分布式平台搭建过程. 目录: 一.前言二.环境搭建三.命令测试 ...
搭建ubuntu14.04的hadoop集群【docker容器充当服务器】
首先弄出来装有hadoop.java.ssh.vim的镜像起名badboyf/hadoop.做镜像有两种方法,一种是用Dockerfile来生成一个镜像,一种是基于ubuntu14.04的基础镜像生成 ...
Hadoop安装及配置
一.系统及软件环境 1.操作系统 CentOS release 6.5 (Final) 内核版本:2.6.32-431.el6.x86_64 master.fansik.com:192.168.83. ...

随机推荐

C# 读取Excel，一波华丽的操作
C# 读取Excel,其实有很多方法.但是今天要来一波华丽的操作. 先看效果: 以上这波操作使用了 ExcelDataReader 和 ExcelDataReader.DataSet 完成的. Exc ...
虚幻4随笔6 Object和序列化
诚如之前所说,虚幻4主要的一些特性都是由UObject穿针引线在一起的,想把虚幻玩到比较深的程度,UObject是迟早要面对.回避不得的问题,所以,准备在其它主题之前,先把UObject好好弄一下.U ...
selenium下拉框踩坑埋坑
本文来自网易云社区作者:王利蓉最近web端全站重构,所有的页面都大大小小都有些变动,UI就全军覆没了,用例从登录改,改到个人信息页面发现根以前的实现方式完全不一样,这可怎么解决 1.以前的实现(o ...
pageadmin CMS网站建设教程：如何修改用户密码？
pageadmin CMS网站建设教程: 当我们想修改密码,该如何修改呢? 1. 首先,登录会员中心,会员中心的地址是在网址后面加上/member/login: 2. 例:我的网站地址是localho ...
Elasticsearch入门 + 基础概念学习
原文地址:https://www.cnblogs.com/shoufeng/p/9887327.html 目录 1 Elasticsearch概述 1.1 Elasticsearch是什么 1.2 E ...
RabbitMQ Java实例
引入RabbitMQ的jar包 <dependency> <groupId>com.rabbitmq</groupId> <artifactId>amq ...
java在编译期和运行期都做了什么
Java对象内存存储,引用传递,值传递详细图解 java对象在内存中的分配编译过程: 编译器把一种语言规范转化为另一种语言规范的这个过程需要哪些步骤?回答这个问题需要参照<编译原理>,总 ...
Markdown 常用操作
1->水平线注意,使用时发现,水平线的语句上一行必须为空行,不然水平线不生效 *** 或者 --- ------->效果: 2->标题 # 大 ## 大 ### 大 #### 大 ...
剑指offer六十之按之把二叉树打印成多行
一.题目从上到下按层打印二叉树,同一层结点从左至右输出.每一层输出一行.二.思路队列LinkedList完成层序遍历,用end记录每层结点数目三.代码 import java.util.Arra ...
django第三课模版
第一步创建项目文件: django-admin.py startproject *** 第二步进入该文件下创建文件夹templates,在该文件夹下创建thanks.html <!DOCTY ...

BG.Hadoop.Master

BG.Hadoop.Master的更多相关文章

随机推荐

热门专题