目录

  1. 前言
  2. 整体介绍
  3. 分步安装介绍
  4. 总结

一、前言

       周末干了近四十个小时中间只休息了五个小时终于成功安装了ClouderaManager以及分布式集群,其中各种辛酸无以言表,唯有泪两行。总体是安装的很慢,但是其中有很多细节问题,需要记录下来使以后再次安装少走弯路,以及给其他有需要的人提供一点参考。

二、整体介绍

       整体上可以借鉴之前我写的一篇博客使用Ambari安装hadoop集群。安装共分三步,第一步安装并配置操作系统(本文采用Ubuntu14.04,其他的可以参考相应安装方法);第二步安装ClouderaManager;第三步安装分布式集群。

三、分步安装介绍

3.1 安装并配置操作系统

       整体配置包括启用root用户等都可以参考上述文章,这里强调一些细节。安装并配置操作系统应该是整个安装过程的核心,能否顺利完成分布式集群安装主要就在这一步,本次仅操作系统就重新安装了5次,已经变成了一个熟练的Ubuntu装机码农。这里面有太多的问题需要考虑,本次之所以折腾这么久,也主要浪费在这上面。根据此次经验我总结一定要注意以下几点:

       1、首先安装版本的选择,一定要安装ClouderaManager支持的版本,ClouderManager5目前Ubuntu只支持到14.04,其他系统可以查看具体要求。

       2、安装过程中时区选择一定要正确并统一,不然会造成时间同步的问题。为了严格时间同步,需要使用apt-get install ntp安装ntp进行时间同步。

       3、网络(IP、DNS等)在安装过程中可以先不进行配置,以节约时间,待安装完成后统一配置内网外IP及网关等,同时配置双网卡需要第一块网卡不在/etc/network/interfaces文件中配置gateway,使用route add -net 192.168.1.0/24 gw 192.168.1.1 dev eth1命令设置第一块网卡的路由,也可以将上述语句写到/etc/rc.local文件里,防止每次重启系统都要重新配置路由。

       4、用户名密码切记一定不要使用古怪的字符包含下划线中划线等等,密码也不要使用弱密码类型,否则真的可能是会出现各种各样莫名其妙、让人无法查找ERROR的问题。

       5、尽量启用系统root用户,否则在配置sudo免密码的时候就会有各种问题,并且在安装ClouderaManager的时候也会出现各种权限问题。

       6、每台机器的hosts配置要准确,不然肯定是要出问题的。

       7、如果网速不够快,可以将ubuntu的源替换成阿里云。

       8、最重要的一点,如果后续步骤一旦安装失败或报错,并且折腾一会之后找不到解决的办法,不要犹豫,马上重装系统,6台机器重装加配置一遍操作系统如果有6个系统盘加KVM的话也就顶多一个小时,但是你要真的去找问题,用上两个小时也不一定能找到问题,只会越来越纠结。

3.2 安装ClouderaManager

       首先切换到root用户,然后使用以下命令下载并安装即可:

wget http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.bin
chmod u+x cloudera-manager-installer.bin
./cloudera-manager-installer.bin

       这里面倒是没有什么特别需要注意的地方,只需要注意下载相应的版本以及在安装的过程中不要出现关机、断网等情况。

3.3 安装分布式集群

       如果前面两步都完成的很好的话这一步应该是很轻松的,本次安装中在最最后看着那一个个轻松飘来的绿色√,真的是喜极而泣、言不成声。但是回首整个过程真的是在安装集群这一步无比辛酸,前两步操作没有注意到的各种细节都会在这里变成一个个无法查找的ERROR,让人痛苦万分。该步需要注意以下细节:

       1、整个安装过程中使用tail -fn 300 /var/log/cloudera-scm-agent/cloudera-scm-agent.log来监控安装中出现的各种问题,有的时候web ui界面显示成功,可能并不是真的成功了,如果接着往下走肯定是不行。本次安装中就是刚开始没注意,在进行cdh分发以及激活的时候前台界面一直显示的成功,但是后来查看日志发现一直在报无法激活的错误,所以导致后续安装根据就不往下进行,只是简单的提示安装hdfs等出错,根本不给任何错误的信息,就无法发现问题,发现问题是解决问题的第一步,发现不了何谈去解决问题,当然造成无法激活的原因我猜测应该就是3.1中讲述的那些。

       2、关于选择单用户还是多用户模式可以根据自己的需要,二者区别并不大,只是多用户会创建hdfs、zookeeper等用户,但是一旦某一种模式安装失败,第二次安装的时候请换另一种模式,不要太执着,否则真的可能是一遍遍的重装仍无法解决问题。

       3、选择安装内容的时候可以先选少一点,比如选择自定义模式并只选spark、hdfs、zookeeper、YARN这几个。因为选的越少出现错误的可能性越小,而等这几个分布式的基础软件安装完毕之后,再安装其他的就很容易,不需要再从安装操作系统开始。

       4、如果集群安装失败可以重新安装一遍,只需要在管理界面点击添加集群,但是要通过管理界面将ClouderaManager中的Cluster1集群删除(默认叫这个名字,因为虽然安装失败但是集群在ClouderaManager中已经有了),然后将所有节点解除授权并从集群删除,否则无法将这些节点再加入到新创建的集群。

四、总结

       失败是安装过程中必然出现的,但是成功是多次失败安装的必然结果。我们要执着又不能太执着——要执着于一次不行两次、两次不行三次,但是又不能执着于不会灵活、不变通,该重装系统就重装系统,该改配置就改配置,该换方案就换方案。最终一定会收获成功。

安装ClouderaManager以及使用ClouderaManager安装分布式集群的若干细节的更多相关文章

  1. Hadoop(三)搭建Hadoop全分布式集群

    原文地址:http://www.cnblogs.com/zhangyinhua/p/7652686.html 阅读目录(Content) 一.搭建Hadoop全分布式集群前提 1.1.网络 1.2.安 ...

  2. HBase HA的分布式集群部署(适合3、5节点)

    本博文的主要内容有: .HBase的分布模式(3.5节点)安装    .HBase的分布模式(3.5节点)的启动 .HBase HA的分布式集群的安装 .HBase HA的分布式集群的启动    .H ...

  3. Hadoop单机/伪分布式集群搭建(新手向)

    此文已由作者朱笑笑授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 本文主要参照官网的安装步骤实现了Hadoop伪分布式集群的搭建,希望能够为初识Hadoop的小伙伴带来借鉴意 ...

  4. Hadoop实战4:MapR分布式集群的安装配置及shell自动化脚本

    MapR的分布式集群安装过程还是很艰难的,远远没有计划中的简单.本人总结安装配置,由于集群有很多机器,手动每台配置是很累的,编写了一个自动化配置脚本,下面以脚本为主线叙述(脚本并不完善,后续继续完善中 ...

  5. (转)ZooKeeper伪分布式集群安装及使用

    转自:http://blog.fens.me/hadoop-zookeeper-intro/ 前言 ZooKeeper是Hadoop家族的一款高性能的分布式协作的产品.在单机中,系统协作大都是进程级的 ...

  6. 在Hadoop1.2.1分布式集群环境下安装hive0.12

    在Hadoop1.2.1分布式集群环境下安装hive0.12 ● 前言: 1. 大家最好通读一遍过后,在理解的基础上再按照步骤搭建. 2. 之前写过两篇<<在VMware下安装Ubuntu ...

  7. hadoop学习之hadoop完全分布式集群安装

    注:本文的主要目的是为了记录自己的学习过程,也方便与大家做交流.转载请注明来自: http://blog.csdn.net/ab198604/article/details/8250461 要想深入的 ...

  8. hadoop伪分布式集群搭建与安装(ubuntu系统)

    1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...

  9. Ambari安装之部署3个节点的HA分布式集群

    前期博客 Ambari安装之部署单节点集群 其实,按照这个步骤是一样的.只是按照好3个节点后,再做下HA即可. 部署3个节点的HA分布式集群 (1)添加机器 和添加服务的操作类似,如下图 之后的添加a ...

随机推荐

  1. tomcat:域名指向项目名

    把项目部署到tomcat目录webapps后,使用域名访问的时候域名后面需要加上项目名称,如果想直接输入域名就可以访问项目呢?看了下tomcat官方文档,我修改了tomcat安装目录下conf/ser ...

  2. Microsoft JScript 运行时错误: 属性“$”的值为 null、未定义或不是 Function 对象

    运行网站时有的页面中可能有的js代码不起作用,原因可能是 JQ引用错误!他找不到JQ的基类!你引用的是JQ的插件.程序是先找到JQ的基类才能去实现插件功能的.把JQ的基类放在所有插件的前面.这样就不会 ...

  3. PHP 文件处理

    $handler = fopen('./abc.html', 'w'); if(!feof($handler)){ // 读取文件末尾,也可以用file_exists mkdir('./abc.htm ...

  4. Concurrency并发性

    今天看了有关性能的文章,性能也是客户所看重的. 文章推荐看了软件编程并发性. 就按书上敲了网址看:http://www.gotw.ca/publications/concurrency-ddj.htm ...

  5. 已经过事务处理的 MSMQ 绑定(转载)

    https://msdn.microsoft.com/zh-cn/biztalk/ms751493 本示例演示如何使用消息队列 (MSMQ) 执行已经过事务处理的排队通信. 注意 本主题的末尾介绍了此 ...

  6. CodeFirst实战:用文本数据库存档软件配置

    背景: 以前要写软件的时候,在编写用户配置这一块时,由于存档数据库不靠谱或大题小作,所以一般是存在文本中. 一开始是一个文件保存一个配置(图个File.Read与File.Write的操作简单) 由于 ...

  7. iOS开发系列--IOS程序开发概览

    概览 终于到了真正接触IOS应用程序的时刻了,之前我们花了很多时间去讨论C语言.ObjC等知识,对于很多朋友而言开发IOS第一天就想直接看到成果,看到可以运行的IOS程序.但是这里我想强调一下,前面的 ...

  8. 《HiWind企业快速开发框架实战》(2)使用HiWind创建自己的项目

    <HiWind企业快速开发框架实战>(2)使用HiWind创建自己的项目 关于HiWind HiWind企业快速开发框架,是基于.NET+EasyUi(支持各种前端扩展,后面将扩展Boot ...

  9. [开源]C#二维码生成解析工具,可添加自定义Logo

    二维码又称 QR Code,QR 全称 Quick Response,是一个近几年来移动设备上超流行的一种编码方式,它比传统的 Bar Code 条形码能存更多的信息,也能表示更多的数据类型:比如:字 ...

  10. java中文乱码解决之道(四)-----java编码转换过程

    前面三篇博客侧重介绍字符.编码问题,通过这三篇博客各位博友对各种字符编码有了一个初步的了解,要了解java的中文问题这是必须要了解的.但是了解这些仅仅只是一个开始,以下博客将侧重介绍java乱码是如何 ...