http://blog.csdn.net/wangloveall/article/details/20767161

摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构。

关键词:Hadoop  全分布模式  文件配置

利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop。

如何基于全分布模式来操作Hadoop,构建Hadoop集群呢?具体步骤如下。

第一步:配置hosts文件。

执行命令: vi  /etc/hosts,修改所有的节点,使得彼此之间都能把主机名解析为ip,即实现主机名与ip的绑定。

第二步:建立Hadoop运行账号

在所有节点上都建立运行Hadoop的账号,建议不要使用root账号,因为其权限最大,有时会带来意想不到的麻烦。

第三步:配置ssh,实现免密码登录

针对每个节点都要进行相同操作

首先,检查是否安装了ssh

依次执行命令:which ssh

which  sshd

which ssh-keygen

其次,生成ssh密钥对

执行命令: ssh-keygen  -r rsa

最后,分发ssh公钥

把各个节点的authorized_keys的内容互相拷贝加入到对方的此文件中

第四步:下载并解压Hadoop安装包

第五步:配置namenode,修改hdfs-site.xml文件

第六步:配置hadoop-env.sh

说明:以上三步配置可以参照伪分布模式操作Hadoop的配置

第七步:配置masters和slaves文件

第八步:向各节点复制Hadoop

第九步:格式化namenode,启动Hadoop

鉴于作者实验环境和资源有限,目前是基于伪分布模式操作Hadoop。因此,上述关于Hadoop全分布模式的操作,作者目前还没有试验过,仅是通过查阅相关文档和资料,进行的一个步骤归总。若有问题或不足,欢迎读者指正。

Source:

http://www.wangluqing.com/2014/02/hadoop-clustermodel-operation/

http://hadoop.apache.org/docs/r1.2.1/cluster_setup.html

3  http://hadoop.apache.org/docs/r1.0.4/cn/cluster_setup.html

4  炼数成金之《Hadoop数据分析平台》课程的第二课,实施Hadoop集群

Hadoop全分布模式操作的更多相关文章

  1. Hadoop伪分布模式操作

    http://blog.csdn.net/wangloveall/article/details/20195813 摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习.开发和调试. 关键 ...

  2. Hadoop 全分布模式 平台搭建

    现将博客搬家至CSDN,博主改去CSDN玩玩~ 传送门:http://blog.csdn.net/sinat_28177969/article/details/54138163 Ps:主要答疑区在本帖 ...

  3. 搭建Hadoop的全分布模式

    此教程仅供参考 注意:此文档目的是为了本人方便以后复习,不适合当教程,以免误导萌新... 1.安装三台Linux2.在每台机器上安装JDK3.配置每台机器的免密码登录 (*) 生成每台机器的公钥和私钥 ...

  4. Hadoop概念学习系列之再谈hadoop集群里的本地模式、伪分布模式和全分布模式(三十七)

    能看懂博主我此博文,相信你已经有了一定基础了. 对于本地模式.伪分布模式和全分布模式的概念,这里,我不多赘述.太多资料和博客,随便在网上一搜就好. 比如<hadoop实战 第二版>陆嘉恒老 ...

  5. 【Hadoop环境搭建】Centos6.8搭建hadoop伪分布模式

    阅读目录 ~/.ssh/authorized_keys 把公钥加到用于认证的公钥文件中,authorized_keys是用于认证的公钥文件 方式2: (未测试,应该可用) 基于空口令创建新的SSH密钥 ...

  6. Linux环境搭建Hadoop伪分布模式

    Hadoop有三种分布模式:单机模式.伪分布.全分布模式,相比于其他两种,伪分布是最适合初学者开发学习使用的,可以了解Hadoop的运行原理,是最好的选择.接下来,就开始部署环境. 首先要安装好Lin ...

  7. Hadoop伪分布模式配置

    本作品由Man_华创作,采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可.基于http://www.cnblogs.com/manhua/上的作品创作. 请先按照上一篇文章H ...

  8. 【原】Hadoop伪分布模式的安装

    Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) ( ...

  9. hadoop伪分布模式的配置和一些常用命令

    大数据的发展历史 3V:volume.velocity.variety(结构化和非结构化数据).value(价值密度低) 大数据带来的技术挑战 存储容量不断增加 获取有价值的信息的难度:搜索.广告.推 ...

随机推荐

  1. (转)代号为Purley的新一代服务器平台

    英特尔(Intel)正式发布了代号为Purley的新一代服务器平台,包括代号为Skylake的新一代至强(Xeon)CPU,命名为英特尔至强可扩展处理器(Intel Xeon Scalable Pro ...

  2. Spring Cloud 学习网址

    1. https://blog.csdn.net/forezp/article/details/70148833  史上最简单的 SpringCloud 教程 (非常适合新手快速上手教程)2.http ...

  3. 20170706wdVBA正则表达式提取题目

    Public Sub GetContents() Dim Reg As Object Dim Matches As Object Dim OneMatch As Object Dim Index As ...

  4. 双机热备(准)-->RAC(夭折)-->DG(异地容灾)

    以下有的地方为oracle专业术语,非懂勿喷.前段时间某项目负责人告知,他们应用需要一套oracle数据库环境运行模式为双机热备.简单了解下对于现在已经非常成熟的RAC再合适不过了.详细问了问当前服务 ...

  5. Unity3D中的函数方法和解释

    一.刷新函数 Update 当MonoBehaviour启用时,其Update在每一帧被调用. LateUpdate 当Behaviour启用时,其LateUpdate在每一帧被调用. FixedUp ...

  6. dp练习(11)——石子并归

    1048 石子归并  时间限制: 1 s  空间限制: 128000 KB  题目等级 : 黄金 Gold 题解       题目描述 Description 有n堆石子排成一列,每堆石子有一个重量w ...

  7. dwz tree组件 取得所选择的值

    DWZ的树结构是按<ul>,<li>的嵌套格式构成,最顶级的<ul>以class=”tree”标识. treeFolder, treeCheck, expand|c ...

  8. 如何解决请求URL长度超过配置的maxurlLength值问题

    当我们批量请求的数据太多时,会出现请求的url长度超过配置maxurllength值的问题(比如一次性操作1000条数据) 1.问题描述: 我在进行批量选择单据进行发送时,出现这个问题(批量500条) ...

  9. Microsoft Word 2007 向程序发送命令时出现问题解决方法

    最近在打开Word文档时总是出现“向程序发送命令时出现问题”对话框,而且不确定性,关闭重新打开有时没事了有时还不行, 很让人头疼,经过尝试,把问题解决了 1.问题截图如下: 2.解决方法 1)方法一: ...

  10. httpclient cookie使用介绍

    COOKIE的处理 session的保持是通过cookie来维持的,所以如果用户有勾选X天免登陆,这个session就X天内一直有效,就是通过这个cookie来维持. 如果没有选中x天免登陆,基本上就 ...