登录 http://node1.com:7180/.用户名和密码都是admin。启动服务命令是

service  cloudera-scm-server start


最开始两个页面直接continue,然后会出现下面这个页面:

可以看出我们可以通过Cloudera Manager安装的hadoop组件。

接下来,配置我们要安装的服务器有哪些:
我这里有三台服务器。

接下来选择cdh版本:我选择最新的5.5.1


是否安装jdk:


是否是单用户模式:我选择不适用



在常规 Cloudera Manager 部署中,管理每个主机上的 Hadoop 进程的 Cloudera Manager Agent 以根用户运行。但是,某些环境限制对根帐户的访问。

Cloudera Manager 5.3 提供了单用户模式,从而满足了对些类环境的要求。在单用户模式中,Cloudera Manager Agent 和所有由 Cloudera Manager 所管理服务运行的进程作为单个配置的用户和组启动。在系统上运行的 Hadoop 进程之间,单用户模式确定 Hadoop 与系统其他部分(隔离以外)之间的隔离的优先级。

在 Cloudera Manager 部署中,单用户模式为全局模式,并且适用于所有由该 Cloudera Manager 实例管理的群集。

默认情况下,单用户为 cloudera-scm,并且在以下部分所描述的配置步骤中假定该用户用单用户。但是,也支持其他用户。如果选择其他用户,请在以下步骤中使用所选用户替换 cloudera-scm,并执行 使用非默认单用户 中的附加步骤。



接下来提供集群的 ssh登录配置。


这里选择了root用户,选择hadoop怎么弄都不行,现在还是没有找到原因。我的hadoop是有user权限的,不知道为什么不行。

接下来就是安装界面:



可以查看details看到运行的脚本。也可以通过网络监控查看下载的速度:


可以看出下载速度其实挺快的。有这个网络监控工具可以大致看到集群内部的连接状态:




安装过程中node2老是报错,经过检查原来是node2上面的hosts文件配置错误,导致不能创建socket。所以集群一定要保证每一台服务器都可以相互通信,这是前提。


然后就是安装cdh了:

下载完成,分发:这里下载只是在server这个机器上下载,下载一次之后分发给其他的服务器:
安装成功之后,进行集群检查,出现如下提示:

第一个警示是:系统的交换参数是60而集群要求的是10,需要进行修改
第二个是 Transparent Huge Page Compaction开启,会极大的影响集群的性能,需要关闭。
修改步骤:
第一个是  /proc/sys/vm/swappiness的值为60 而不是10,而这个文件是不能够修改的。解决方法是修改 /etc/sysctl.conf 增加vm.swappiness=10在最后
第二个直接运行echo never > /sys/kernel/mm/transparent_hugepage/defrag 然后增加同样的命令道系统初始化的脚本中。 /etc/rc.local 加在这个文件里面

然后是设置集群


集群配置我选择默认,感觉node1服务比较多,配置低的盆友可以适当均匀一下。
然后是测试数据库:集群需要使用数据库进行工作,包括hive等进行存储元数据



完成安装:




Charles 于2015-12-17 Phnom Penh



版权说明:
本文由Charles Dong原创,本人支持开源以及免费有益的传播,反对商业化谋利。
CSDN博客:http://blog.csdn.net/mrcharles
个人站:http://blog.xingbod.cn
EMAIL:charles@xingbod.cn

hadoop再次集群搭建(5)-CDH Install的更多相关文章

  1. hadoop再次集群搭建(4)-Cloudera Manager Installation

       决定选择 Cloudera Manager 进行安装,阅读官方文档,掌握大概脉络.         Cloudera Manager在集群已经实现ssh免秘钥登录,能够访问网络资源和本地资源的情 ...

  2. hadoop再次集群搭建(3)-如何选择相应的hadoop版本

    之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题. 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费. (2) 是否有 ...

  3. hadoop再次集群搭建(1)-安装系统

    从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了.其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout.个人对算法比较感兴 ...

  4. hadoop再次集群搭建(2)-配置免秘钥ssh登录

    SSH对于大多程序员都不陌生,目前主流的云服务提供上也是通过SSH来提供链接的安全保障,比如AWS通过使用下载的私钥(private key)实现与EC2实例安全连接.GitHub通过上传的公钥(pu ...

  5. CDH 6.0.1 集群搭建 「Before install」

    从这一篇文章开始会有三篇文章依次介绍集群搭建 「Before install」 「Process」 「After install」 继上一篇使用 docker 部署单机 CDH 的文章,当我们使用 d ...

  6. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  7. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  8. Hadoop+HBase 集群搭建

    Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...

  9. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

随机推荐

  1. Linux文件压缩/打包/解压

    在Linux日常维护中,经常需要备份同步一些比较重要的文件,而在传输过程中如果文件比较大往往会非常慢,而且还会非常占用空间,这时候就需要我们使用压缩工具对大文件进行压缩打包,下面我们来介绍一下常用的压 ...

  2. review02

    位运算符 按为与运算符和按位或运算符都是二目运算符 按位非运算符是单目运算符 按位异或运算符的法则有: a^a=0; a^0=a; a^b^b=a; instanceof是二目运算符,左边的操作是一个 ...

  3. [thinkphp使用phpspreadsheet时出现]Cannot redeclare xxxxxx() (previously declared in C:\WWW\xxx.xxx:xxx)

    [thinkphp使用phpspreadsheet时出现]Cannot redeclare xxxxxx() (previously declared in C:\WWW\xxx.xxx:xxx) 一 ...

  4. spring boot: Annotation 注解之@Target的用法介绍

    前言 目前,越来越多的架构设计在使用注解,例如spring3.0.struts2等框架.让我们先来看看注解的定义.如下是一段使用了JDK 5 Annotation @Target的代码: @Targe ...

  5. DecimalFormat数据格式函数

    DecimalFormat数据格式函数 class FormatDemo2{ public void format(String pattern, double value) { DecimalFor ...

  6. ACM提交,C++,G++,C,GCC的区别

    今天做了一道水题,POJ-1004,水题一个,12个double类型的数求平均数 但是, #include <iostream> #include <cstdio> using ...

  7. python_安装python2.7.7和easy_install

    [环境]: WIN7 + 32位 [要求]: 安装python2.7.7, easy_install 1. 下载并安装python2.7.7 首先访问http://www.python.org/dow ...

  8. Spring框架实现——远程方法调用RMI代码演示

    1.spring_RMI02_server服务端02 <?xml version="1.0" encoding="UTF-8"?> <bean ...

  9. 【JVM】java的内存泄露问题

    一.GC可回收的对象 二:什么是内存泄露--->Java的一个最显著的优势是内存管理.你只需要简单的创建对象而不需要负责释放空间,因为Java的垃圾回收器会负责内存的回收.然而,情况并不是这样简 ...

  10. Directx 9 VS2015环境搭建

    安装好Directx9 sdk和vs2015后 打开vs,新建项目 --> c++项目  -->win32控制台应用程序-->空项目 创建项目后,右键项目属性, 包含目录 D:\Pr ...