ubantu 16.4 Hadoop 完全分布式搭建

一个虚拟机

　　1.以 NAT网卡模式装载虚拟机
　　2.最好将几个用到的虚拟机修改主机名，静态IP /etc/network/interface，这里是 s101 s102 s103 三台主机 ubantu，改/etc/hostname文件

　　3.安装ssh
- 　　在第一台主机那里s101 创建公私密匙
  - 　　ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  - >cd .ssh
  - >cp id_rsa.pub >authorized_keys 　创建密匙库
  - 将id_rsa.pub传到其他主机上，到.ssh目录下
    1. 通过服务端 nc -l 8888 >~/.ssh/authorized_keys
    2. 客户端 nc s102 8888 <id_rsa.pub

开始安装Hadoop/jdk

安装VM-tools 方便从win 10 拖拉文件到ubantu
创建目录 /soft
改变组 chown ubantu:ubantu /soft 方便传输文件有权限
将文件放入到/soft （可以从桌面cp/mv src dst）
- tar -zxvf jdk或hadoop 自动创建解压目录
- 配置安装环境（/etc/environment）
1. 1. 添加　　JAVA_HOME=/soft/jdk-...jdk目录
  2. 添加　　HADOOP_HOME=/soft/hadoop（Hadoop目录）
  3. 在path里面加/soft/jdk-...jdk/bin:/soft/hadoop/bin/:/soft/hadoop/sbin
  4. 通过 java -version 查看有版本号成功
  5. hadoop version 有版本号成功

　　开始配置HDFS四大文件 core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml

core-site.xml

<configuration>

  <property>

      <name>fs.defaultFS</name>

      <value>hdfs://s101:9000</value>

  </property>

</configuration>

2.hdfs-site.xml

<configuration>

<!-- Configurations for NameNode: -->

<property>

  <name>dfs.replication</name>

  <value>2</value>

</property>

<property>

  <name>dfs.namenode.name.dir</name>

  <value>file:/data/hdfs/name</value>

</property>

<property>

  <name>dfs.datanode.data.dir</name>

  <value>file:/data/hdfs/data</value>

</property>

<property>

  <name>dfs.namenode.secondary.http-address</name>

  <value>s101:50090</value>

</property>

<property>

  <name>dfs.namenode.http-address</name>

  <value>s101:50070</value>

  <description>

    The address and the base port where the dfs namenode web ui will listen on.

    If the port is 0 then the server will start on a free port.

  </description>

</property> 

<property>

  <name>dfs.namenode.checkpoint.dir</name>

  <value>file:/data/hdfs/checkpoint</value>

</property>

<property>

  <name>dfs.namenode.checkpoint.edits.dir</name>

  <value>file:/data/hdfs/edits</value>

</property>

</configuration>

3. mapred-site.xml

<configuration>

  <property>

       <name>mapreduce.framework.name</name>

       <value>yarn</value>

   </property>

</configuration>

4.yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

  <property>

          <name>yarn.nodemanager.aux-services</name>

          <value>mapreduce_shuffle</value>

  </property>

  <property>

          <name>yarn.resourcemanager.hostname</name>

          <value>s101</value>

  </property>

</configuration>

到此成功一半。。。。。。。。。。。。。。

创建文件夹

mkdir /data/hdfs/tmp

mkdir /data/hdfs/var

mkdir /data/hdfs/logs

mkdir /data/hdfs/dfs

mkdir /data/hdfs/data

mkdir /data/hdfs/name

mkdir /data/hdfs/checkpoint

mkdir /data/hdfs/edits

记得将目录权限修改

sudo chown ubantu:ubantu /data

接下来传输 /soft文件夹到其他主机

创建 xsync可执行文件

sudo touch xsync
sudo chmod 777 xsync 权限变成可执行文件
sudo nano xsync

#!/bin/bash

pcount=$#

if((pcount<));then

    echo no args;

    exit;

fi

p1=$;

fname=`basename $p1`

pdir=`cd -P $(dirname $p1);pwd`

cuser=`whoami`

for((host= ; host< ;host=host+));do

    echo --------s$host--------

    rsync -rvl $pdir/$fname $cuser@s$host:$pdir

done

xsync /soft-------->就会传文件夹到其他主机
xsync /data

创建 xcall 向其他主机传命令

#!/bin/bash

pcount=$#

if((pcount<));then

    echo no args;

    exit;

fi

echo --------localhost--------

$@

for ((host=;host<;host=host+));do

    echo --------$shost--------

    ssh s$host $@

done

别着急快结束了哈

还得配置 workers问价

将需要配置成数据节点（DataNode）的主机名放入其中，一行一个

注意重点来了

先格式化 hadoop -namenode -format
再启动 start-all.sh
查看进程 xcall jps
进入网页
是不是很想牛泪，成功了耶！！！

中间出现了很多问题

　　1， rsync 权限不够：删除文件夹更改文件夹权限chown

　　2.学会看日志 log

ubantu 16.4 Hadoop 完全分布式搭建的更多相关文章

hadoop完全分布式搭建HA（高可用）
2018年03月25日 16:25:26 D调的Stanley 阅读数:2725 标签: hadoop HAssh免密登录hdfs HA配置hadoop完全分布式搭建zookeeper 配置更多个 ...
超详细解说Hadoop伪分布式搭建--实战验证【转】
超详细解说Hadoop伪分布式搭建原文http://www.tuicool.com/articles/NBvMv2原原文 http://wojiaobaoshanyinong.iteye.com/b ...
3.hadoop完全分布式搭建
3.Hadoop完全分布式搭建 1.完全分布式搭建配置 #cd /soft/hadoop/etc/ #mv hadoop local #cp -r local full #ln -s full ha ...
Hadoop伪分布式搭建（一)
下面内容主要说明在Windows虚拟机上面,怎么搭建一个Hadoop伪分布式,并如何运行wordcount程序和网页查看HDFS文件系统. 1 相关软件下载和安装 APACH官网提供hadoop版本 ...
Hadoop伪分布式搭建步骤
说明: 搭建环境是VMware10下用的是Linux CENTOS 32位,Hadoop:hadoop-2.4.1 JAVA :jdk7 32位:本文是本人在网络上收集的HADOOP系列视频所附带的 ...
Hadoop 完全分布式搭建
搭建环境 https://www.cnblogs.com/YuanWeiBlogger/p/11456623.html 修改主机名------------------- 1./etc/hostname ...
hadoop 伪分布式搭建
下载hadoop1.0.4版本,和jdk1.6版本或更高版本:1. 安装JDK,安装目录大家可以自定义,下面是我的安装目录: /usr/jdk1.6.0_22 配置环境变量: [root@hadoop ...
Hadoop完全分布式搭建过程中遇到的问题小结
前一段时间,终于抽出了点时间,在自己本地机器上尝试搭建完全分布式Hadoop集群环境,也是借助网络上虾皮的Hadoop开发指南系列书籍一步步搭建起来的,在这里仅代表hadoop初学者向虾皮表示衷心的感 ...
Hadoop完全分布式搭建流程
centos7 搭建完全分布式 Hadoop 环境 SSR 前言本次教程是以先创建四台虚拟机为基础,再配置好一台虚拟机的情况下,直接复制文件到另外的虚拟机中(这样做大大简化了安装流程) 且本次 ...

随机推荐

Celery启动Django项目：Client sent AUTH, but no password is set 错误处理
celery -A CeleryTest worker -l info [2017-02-22 07:26:52,666: ERROR/MainProcess] consumer: Cannot co ...
【转载】SQL Server 版本列表
Quick summary: RTM (no SP) SP1 SP2 SP3 SP4 SQL Server 2017 codename vNext not yet released ...
Hadoop和Apache Spark的异同
谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生.但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同. 1.解决问 ...
PHP：WampServer下如何安装多个版本的PHP、mysql、apache
作为Web开发人员,在机器上安装不同版本的php,apache和mysql有时是很有必要的. 今天,我在调试一套PHP程序的时候,该程序中使用的某些函数在低版本中无法使用,所以只能在搞个高版本的php ...
C++与C的联系与区别
C++与C的联系: C++是在C语言的基础上开发的一种面向对象编程语言,应用广泛.C++支持多种编程范式 --面向对象编程.泛型编程和过程化编程. 其编程领域众广,常用于系统开发,引擎开发等应用领域, ...
【Canal源码分析】重要类图
从Canal的整体架构中,我们可以看出,在Canal中,比较重要的一些领域有Parser.Sink.Store.MetaManager.CanalServer.CanalInstance.CanalC ...
JVM Scan
1.jmap -histo pid|head -100 2.jstat -gcutil pid cycle 3.jmap -heap pid
Linux-(ping,traceroute,ss)
ping命令 1.命令格式: ping [参数] [主机名或IP地址] 2.命令功能: ping命令用于:确定网络和各外部主机的状态:跟踪和隔离硬件和软件问题:测试.评估和管理网络.如果主机正在运行并 ...
Spring-IOC注解
注解主要的目的就是实现零XML配置.一:自动扫描装配Bean. spring为我们引入了组件自动扫描机制,它可以在类路径底下寻找标注了@Component.@Service.@Controller.@ ...
Javascript权威指南阅读笔记--第3章类型、值和变量(1)
之前一直有个想法,好好读完JS权威指南,便于自己对于JS有个较为全面的了解.毕竟本人非计算机专业出生,虽然做着相关行业的工作,但总觉得对于基础的掌握并没有相关专业学者扎实,正好因为辞职待业等原因,还是 ...

ubantu 16.4 Hadoop 完全分布式搭建

ubantu 16.4 Hadoop 完全分布式搭建的更多相关文章

随机推荐

热门专题