• 经过前边的积累,今天最终实现了集群环境下部署Hadoop。并成功执行了官方的样例。
工作例如以下:
  • 两台机器:
  1. NameNode:上网小本,3G内存。机器名:YP-X100e,IP:192.168.101.130。
  2. DataNode:虚拟机,Win7下载VMWare10中虚拟Ubuntu14,虚拟机器名:ph-v370,IP:192.168.101.110
  3. 确保可互相ping通,依照机器名和IP配置各自机器的/etc/hosts文件和/etc/hostname文件。我的hosts配置内容例如以下
127.0.0.1 localhost
192.168.101.130 YP-X100e
192.168.101.110 ph-v370

  • 安装环境,请參考
  1. Ubuntu14下Hadoop开发<1> 基础环境安装
  2. Ubuntu14下Hadoop开发<2> 编译64位Hadoop2.4
  • 配置各种配置信息,请參考
  1. Hadoop 2.4.0全然分布式平台搭建、配置、安装
  2. Setting up a Single Node Cluster.
  • 注意事项:
        A:主从机的ssh设置,主机中在终端中输入

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

复制文件到从节点

scp authorized_keys ph-v370:~/.ssh/

刚開始我一直失败的原因是用户不一致,导致一直无法登陆ssh。后来我新建了hadoop用户。并授予hadoop目录的权限

useradd -m hadoop
passwd hadoop
chown hadoop:hadoop hadoop-2.4.0

又一次用hadoop的用户进行操作就能够了(包含启动hadoop服务等,最好都是用这个用户)

B:运行start-dfs.sh。子节点报异常“WARNorg.apache.hadoop.hdfs.server.datanode.DataNode: Problem connecting to server:YP-X100e/192.168.101.130:9000”
这里有一个卡点,须要改动主节点的hosts文件。凝视掉127.0.1.1这行,你能够在凝视之前运行
netstat -an | grep 9000

你会看到9000port被127.0.1.1占用,所以会出现异常

       C:格式化文件系统的命令应该是
hdfs namenode -format

D:Hadoop的服务和Yarn的服务须要单独启动

start-dfs.sh
start-yarn.sh

E:在主节点配置好全部的配置文件,直接都复制到从节点就可以

       F:跟做单节点样例的时候不同,我在复制文件的时候须要制定确切的路径,如这个:
原来直接运行
$ bin/hdfs dfs -put etc/hadoop input
如今须要运行
$ bin/hdfs dfs -put etc/hadoop /user/chenph/input

G:查进程使用命令是:PS -ef | grep ‘搜索内容’,杀进程是:kill -s 9 进程号。查看防火墙是:sudo ufw status

       H:可訪问主节点查看Hadoop的状态http://YP-X100e:50070。下图可看到,有一个活动的从节点,也就是我的虚拟机中的那个Ubuntu

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveXVlcml0aWFu/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">







Ubuntu14(64位) 集群环境下安装Hadoop2.4的更多相关文章

  1. 在Hadoop1.2.1分布式集群环境下安装hive0.12

    在Hadoop1.2.1分布式集群环境下安装hive0.12 ● 前言: 1. 大家最好通读一遍过后,在理解的基础上再按照步骤搭建. 2. 之前写过两篇<<在VMware下安装Ubuntu ...

  2. 分布式集群环境下,如何实现session共享三(环境搭建)

    这是分布式集群环境下,如何实现session共享系列的第三篇.在上一篇:分布式集群环境下,如何实现session共享二(项目开发)中,准备好了一个通过原生态的servlet操作session的案例.本 ...

  3. redis 与java的连接 和集群环境下Session管理

    redis 的安装与设置开机自启(https://www.cnblogs.com/zhulina-917/p/11746993.html)  第一步: a) 搭建环境 引入 jedis jar包 co ...

  4. 在tomcat集群环境下redis实现分布式锁

    上篇介绍了redis在集群环境下如何解决session共享的问题.今天来讲一下如何解决分布式锁的问题 什么是分布式锁? 分布式锁就是在多个服务器中,都来争夺某一资源.这时候我们肯定需要一把锁是不是 , ...

  5. weblogic 12C集群环境下的session复制

    做过weblogic集群环境的人应该都清楚,要想实现session同步,必须满足两个条件:第一,在weblogic.xml里面增加session同步相关的代码:第二,所有放入session的类都要序列 ...

  6. Oracle RAC 集群环境下日志文件结构

    Oracle RAC 集群环境下日志文件结构 在Oracle RAC环境中,对集群中的日志的定期检查是必不可少的.通过查看集群日志,可以早期定位集群环境中出现的问题,以便将问题消灭在萌芽状态.简单介绍 ...

  7. CAS服务器集群和客户端集群环境下的单点登录和单点注销解决方案

    CAS的集群环境,包括CAS的客户应用是集群环境,以及CAS服务本身是集群环境这两种情况.在集群环境下使用CAS,要解决两个问题,一是单点退出(注销)时,CAS如何将退出请求正确转发到用户sessio ...

  8. 分布式集群环境下,如何实现session共享一(应用场景)

    在web应用中,由于http的请求响应式,无状态.要记录用户相关的状态信息,比如电商网站的购物车,比如用户是否登录等,都需要使用session.我们知道session是由servlet容器创建和管理, ...

  9. 分布式集群环境下,如何实现session共享五(spring-session+redis 实现session共享)

    这是分布式集群环境下,如何实现session共享系列的第五篇.在上一篇:分布式集群环境下,如何实现session共享四(部署项目测试)中,针对nginx不同的负载均衡策略:轮询.ip_hash方式,测 ...

随机推荐

  1. PostCss 从0开始

    PostCss 摘自 http://ju.outofmemory.cn/entry/215105 http://www.w3cplus.com/PostCSS/postcss-deep-dive-pr ...

  2. J2SE知识点摘记(十一)

    Thread t ↓ synchromized(this)                     线程t得到对象的锁标志 ↓                                   此时 ...

  3. Oracle EBS-SQL (SYS-12):查询各Profile的设置情况.sql

    SELECT pro.profile_option_name, pro.user_profile_option_name, lev.level_type TYPE, --lev.level_code, ...

  4. 如何在程序中动态设置墙纸(使用IActiveDesktop接口)

    大家都知道设置WINDOWS桌面墙纸的WIN32 API是SystemParametersInfo, 使用SPI_SETDESKWALLPAPER参数便能设置墙纸: ::SystemParameter ...

  5. Qt中各个widget前后位置的设定(在Qt中,所有问题都要一分为二,QWidget体系和QGraphicsWidget体系)

    这两天在总结一些以往project中遇到的问题,正好别组有同事问我关于Qt中各个widget窗口的前后位置是如何定义的,这里就总结一下: 在Qt中,所有问题都要一分为二,讨论两种不同的情况:一个是最常 ...

  6. 使WEBBROWSER 可编辑

    procedure TForm1.CheckBox1Click(Sender: TObject);begin  {这里是让整个页面可编辑, 也可以单独编辑某个元素}  WebBrowser1.OleO ...

  7. Linux c 信号量

    信号量(通过进程通信实现进程间的同步) 信号量(semaphore)信号灯 信号量是共享内存整数数组.根据需要定义指定的数组长度 信号量就是根据数组中的值,决定阻塞还是解除阻塞 编程模型: 1.    ...

  8. C#动态编译、执行代码

    在开始之前,先熟悉几个类及部分属性.方法:CSharpCodeProvider.ICodeCompiler.CompilerParameters.CompilerResults.Assembly. 一 ...

  9. 为什么需要Page Object?

    为什么需要Page Object? Page Object(PO)是界面自动化验收测试中的一个常见模式,要和@槽神刘叫兽探讨一下PO的必要性,顾写这篇小文表达一下我的观点. PO的主要价值体现在对界面 ...

  10. XmlSerializer

    XmlSerializer作用是将对象序列化到 XML 文档中和从 XML 文档中反序列化对象.XmlSerializer 使您得以控制如何将对象编码到 XML 中. 所在的命名空间:System.X ...