一、虚拟机环境搭建

  我们用的虚拟机为vmware,Linux镜像为centOS6.5.

  vmware安装

  安装没什么多说的,一路下一步,但是在新建虚拟机的时候有两个地方需要注意:

    1.分配处理器1个就好了,毕竟现在搭的是伪分布式

    2.内存分配多一些,这个就看自己机器的情况了

    3.网络设置为NAT,不然会有连不上网的问题

  centOS6.5安装

    将镜像文件添加至虚拟机中,这个CentOS6.5安装比较傻瓜式,不用自己操作,不像之前在CentOS7的安装,还需要自己进行分区,各种设置。

  CentOS6.5配置网络环境

    1.进入Linux,右击网络->edit connection->双击你的网卡进行ip配置

      ipv4setting->manual->add->address network gateway分别为虚拟机上面的编辑->虚拟网络编辑器->第二个NAT模式中的各种网络配置

      我的网络为192.168.32.100 255.255.255.0 192.168.32.2

    2.命令行输入ifconfig,查看当前虚拟机的IP,若IP为192.168.32.100则配置正确

    3.将给好的jdk-8u121-linux-x64.tar.gz包和hadoop-2.6.0.tar.gz包上传至~/hadoop/(/home/qjx/hadoop/)目录下面

    4.修改主机名称(root)vim /etc/sysconfig/network 修改HOSTNAME为当前用户名qjx,重启后生效

    5.重启后关闭防火墙(root)vim /etc/init.d/iptables stop

  当前linux环境配置如下:

    用户:qjx 123456

    IP:192.168.32.100

    主机名:qjx

二、JDK安装

  1.进入hadoop目录

   cd hadoop/

  2.将hadoop/目录下的jdk-8u121-linux-x64.tar.gz解压

   tar -zxvf jdk-linux.tar.gzjdk-8u121-linux-x64.tar.gz

  3.编辑/etc/profile文件,并在最后将jdk配置到path(root)

    vim /etc/profile

    JAVA_HOME=/home/qjx/hadoop/jdk1.8.0_121

    export PATH=$PATH:$JAVA_HOME/bin

   使更改生效(qjx)

    source /etc/profile

   检验path是否正确可以在命令行输入echo $PATH

三、hadoop安装和伪分布式基本配置

  1.进入hadoop/目录

    cd hadoop/

  2.解压hadoop/目录下的hadoop-2.6.0.tar.gz,完成后会在当前hadoop目录下有hadopp-2.6.0目录

    tar -zxvf hadoop-2..6.0.tar.gz

  3.修改hadoop-2.6.0/etc/hadoop/hadoop-env.sh文件,增加一行

    export JAVA_HOME=/home/qjx/hadoop/jdk-1.8.0_121

  4.修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml,在configaration标签中添加配置

    <property>

      <name>fs.defaultFS</name>

      <value>hdfs://qjx:9000</value>

    </property>

    ps:此文件配置了hdfs的访问路径,qjx即为自己主机名

  5.修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml,添加配置标签

    <property>

      <name>dfs.replication</name>

      <value>1</value>

    </property>

    ps:此文件配置了hdfs节点的副本数(block),因为是单节点伪分布式,所以只需要一个

  6.修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml ,这个文件不存在,需要复制一份tmp

    cp hadoop-2.6.0/etc/hadoop/mapred-site.xml.template hadoop-2.6.0/etc/hadoop/mapred-site.xml

   添加配置

    <property>

     <name>mapreduce.framework.name</name>

    <value>yarn</value>

   </property>

  7.修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml

    <property>

     <name>yarn.nodemanager.aux-services</name>

     <value>mapreduce_shuffle</value>

   </property>

  到此为止,配置文件已经修改完成

四、格式化hdfs和启动伪分布式集群

  1. 修改/etc/hosts文件(root),添加 一行 主机IP 主机名

    192.168.32.100  qjx

  2.格式化HDFS,在hadoop解压目录下(/home/qjx/hadoop/hadoop-2.6.0/),执行如下命令:

    bin/hdfs namenode -format

  注意:格式化只能操作一次,如果因为某种原因,集群不能用, 需要再次格式化,需要把上一次格式化的信息删除,在/tmp目录里执行 rm –rf *(默认将namenode存在/tmp/中,如果后续有操作将配置文件hdfs-site.xml的namenode的值改为了自定义的路径,则删除自己定义的目录)

  3.启动集群,在hadoop解压目录下,执行如下命令:

    sbin/start-all.sh 需要输入四次当前用户的密码,如果想要不输入密码,可通过配置ssh互信解决,下面有详细方法

  4.启动后,命令行输入jps,检查有以下的输出:

    [qjx@qjx hadoop-2.6.0]$ jps

    32033 Jps

    31718 SecondaryNameNode

    31528 DataNode

    31852 ResourceManager

    31437 NameNode

    31949 NodeManager

   ps:如果碰到缺少某一项,则去hadoop-2.6.0/logs/下面找相应缺少的文件log日志中的错误去解决

  5.关闭集群命令:

    sbin/stop-all.sh 同样需要输入四次密码

五、ssh互信配置(rsa加密方法)

  互信,顾名思义,互相信任,即将两个主机通过公钥,私钥添加互相信任,配置完成可以不用输入密码即可连接ssh

  1.命令行输入:ssh-keygen 后,一直Enter,完事(会在根目录下生成三个文件id_rsa,id_rsa.pub,known_hosts)

  2.把公钥给信任的主机(本机)

    命令行输入 ssh-copy-id 主机名

     ssh-copy-id qjx

    这个过程需要输入信任主机的密码

  3.验证是否成功,在命令行输入 ssh 信任主机名称

    ssh qjx

  若无提示输入密码,则配置成功

hadoop学习第一天-hadoop初步环境搭建&伪分布式计算配置(详细)的更多相关文章

  1. Hadoop学习笔记—22.Hadoop2.x环境搭建与配置

    自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...

  2. 学习Linux(一)环境搭建

    零基础学习Linux(一)环境搭建 从本文开始我会为大家介绍一下linux环境下详细的集群环境安装.配置.部署到实例演示的整个过程.在此过程中会给大家详细介绍一下Linux的操作技巧和一些工具的使用. ...

  3. qt学习教程1.qt开发环境搭建

    qt学习教程1.qt开发环境搭建 首先下载qt 下载地址:http://download.qt.io/archive/qt/ 此教程使用的版本为5.1.1 下载好后,打开安装包,然后点下一步 选择一个 ...

  4. [转帖]hadoop学习笔记:hadoop文件系统浅析

    hadoop学习笔记:hadoop文件系统浅析 https://www.cnblogs.com/sharpxiajun/archive/2013/06/15/3137765.html 1.什么是分布式 ...

  5. 学习不一样的Vue1:环境搭建

    学习不一样的Vue1:环境搭建  发表于 2017-05-31 |  分类于 web前端|  |  阅读次数 11677 首先 首发博客: 我的博客 项目源码: 源码 项目预览: 预览 因为个人的喜好 ...

  6. Solr学习笔记之1、环境搭建

    Solr学习笔记之1.环境搭建 一.下载相关安装包 1.JDK 2.Tomcat 3.Solr 此文所用软件包版本如下: 操作系统:Win7 64位 JDK:jdk-7u25-windows-i586 ...

  7. ESP32学习笔记(一) 环境搭建与下载

    ESP32学习笔记(一) 环境搭建与下载 作者:Nevel 博客:nevel.cnblogs.com 转载请保留出处 前几天刚入手了ESP32模块,趁着放假有时间,我们先把ESP32的编译环境搭建好 ...

  8. Python+NLTK自然语言处理学习(一):环境搭建

    Python+NLTK自然语言处理学习(一):环境搭建 参考黄聪的博客地址:http://www.cnblogs.com/huangcong/archive/2011/08/29/2157437.ht ...

  9. Java学习笔记【一、环境搭建】

    今天把java的学习重新拾起来,一方面是因为公司的项目需要用到大数据方面的东西,需要用java做语言 另一方面是原先使用的C#公司也在慢慢替换为java,为了以后路宽一些吧,技多不压身 此次的学习目标 ...

随机推荐

  1. Phpcms·二次开发

    PHPCMS V9产品介绍 PHPCMS V9(简称V9)采用PHP5+MYSQL做为技术基础进行开发.V9采用OOP(面向对象)方式进行基础运行框架搭建.模块化开发方式做为功能开发形式.框架易于功能 ...

  2. [0] AssemblyInfo.cs文件介绍

    AssemblyInfo.cs文件:包含程序版本.信息.版权的属性文件 先介绍AssemblyInfo.cs文件中的程序集属性 内容: using System.Reflection;using Sy ...

  3. CSS的小三角

    上三角▲ width: 0; height: 0; line-height: 0; font-size: 0; border-width: 10px; border-style: solid; bor ...

  4. 浅谈js中的正则表达式

    很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下: 正则表达式的创建 两种方法,一种是直接写,由包含在斜杠之间的模式组成:另一种是调用RegExp对象的构造函数 ...

  5. 各开放平台API接口通用SDK序列文章 前言

    最近两年一直在做API接口相关的工作,在平时工作中以及网上看到很多刚接触API接口调用的新人一开始会感到很不适应,要看的文档一大堆,自己要调用的接口找不着,或都找着了不知道怎么去调用,记得包括自己刚开 ...

  6. Java锁Synchronized,对象锁和类锁举例

    Java的锁分为对象锁和类锁. 1. 当两个并发线程访问同一个对象object中的这个synchronized(this)同步代码块时,一个时间内针对该对象的操作只能有一个线程得到执行.另一个线程必须 ...

  7. Chapter 5. MPEG-4 Visual

    本章着重介绍有关MPEG-4 Visual标准的细节. Tool 编码工具集合的子集(比如支持交织等). Object 视频元素(比如一个矩形视频帧,或者一个任意形状的区域,静止的图像). Profi ...

  8. 使用solr6.0搭建solrCloud

    一.搭建zookeeper集群 1.下载zookeeper压缩包到自己的目录并解压(本例中的目录在/opt下),zookeeper的根目录我们在这里用${ZK_HOME}表示. 2.在${ZK_HOM ...

  9. Java基础(6)- 面向对象解析

    java面向对象 对象 知识点 java 的方法参数是按值调用,是参数的一份拷贝 封装 使用private将 属性值/方法 隐藏,外部只能调用 get,set方法/非private 的接口 获取 重载 ...

  10. 基于Metronic的Bootstrap开发框架经验总结(15)-- 更新使用Metronic 4.75版本

    在基于Metronic的Bootstrap开发框架中,一直都希望整合较新.较好的前端技术,结合MVC的后端技术进行项目的开发,随着时间的推移,目前Metronic也更新到了4.75版本,因此着手对这个 ...