ubuntu14.04, Cloudera Manager 5.11.1, cdh5.11.1 postgresql离线部署
最近一段时间团队接到的项目需要处理的数据量非常大,之前的处理方式难以满足现有需求。最近两周前前后后折腾了不少,在搭建了hadoop+hbase+hive+spark的一个集群后,由于感觉管理和监控太麻烦就把它给干掉了,转而折腾CDH。
安装CDH前需要安装Cloudera Manager,官方文档提供的A,B,C三种安装方式。方式A傻瓜式的安装部署,安装时最好祈祷一次成功,否则卸载时时候非常麻烦。本文主要介绍方式C的部署。
系统环境以及相关软件版本
- 机器数量:4台PC,名称分别为Master, Slave1, Slave2, Slave3.

 - 操作系统版本:Ubuntu 14.04
 - Cloudera Manager: 5.11.1,下载链接
 - CDH:5.11.1,CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel和CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel.sha1,下载链接
 - JDK:1.8.0_131
 - Postgresql:9.3
 
准备环境
- 运行Cloudera Manager的账号:用户名hadoop,用户组hadoop,密码hadoop。(继续利用之前集群的账号)
 - JDK安装:http://www.linuxidc.com/Linux/2015-09/122876.htm
 - 主节点ssh无密码访问从节点:http://www.xuebuyuan.com/1875614.html,向全部节点的/etc/hosts文件添加集群个节点和对应ip.
 
192.168.1.110   Master
192.168.1.100   Slave1
192.168.1.120   Slave2
192.168.1.130   Slave3
Postgresql配置
开启外网访问;
添加Cloudera Manager所需用户和数据库:
- 连接pg:
$ sudo -u postgres psql - 为Cloudera Manager Server添加用户和数据库
 
postgres=# CREATE ROLE scm LOGIN PASSWORD 'scm';
postgres=# CREATE DATABASE scm OWNER scm ENCODING 'UTF8';
- 为Activity Monitor, Reports Manager, Hive Metastore Server, Hue Server, Sentry Server, Cloudera Navigator Audit Server,  Cloudera Navigator Metadata Serve添加数据库和用户。

对于8.2.23以及更高版本的PostgreSQL,执行一下语句 
postgres=# ALTER DATABASE Metastore SET standard_conforming_strings = off;
Cloudera Manager Server和Agents部署
服务端和服务端安装
- 复制cloudera-manager-trusty-cm5.11.1_amd64.tar.gz到所有节点。
 - 创建Cloudera Manager的主目录且解压安装包
 
构建目录
$ sudo mkdir /opt/cloudera-manager
$ ssh hadoop@slave1 'sudo mkdir /opt/cloudera-manager'
$ ssh hadoop@slave2 'sudo mkdir /opt/cloudera-manager'
$ ssh hadoop@slave3 'sudo mkdir /opt/cloudera-manager'
进入所有节点解压安装包:
$ sudo tar xzf cloudera-manager-trusty-cm5.11.1_amd64.tar.gz -C /opt/cloudera-manager
在所有节点上创建用户cloudera-scm
注意目录为刚才解压的cdh压缩包下面的路径
$ sudo useradd --system --home=/opt/cloudera-manager/cm-5.11.1/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm
创建Cloudera Manager服务端的本地文件夹
//仅Master节点
$ sudo mkdir /var/lib/cloudera-scm-server
$ sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-server
Cloudera Manager客户端配置
进入所有客户端节点中的/opt/cloudera-manager/cm-5.11.1/etc/cloudera-scm-agent/config.ini,将server_host值改为服务器ip,server_port保持不变:
# Hostname of the CM server.
server_host=Master
# Port that the CM server is listening on.
server_port=7182
创建Parcel文件夹
- 在服务端建立parcel源文件夹,存放CDH安装包,便于Cloudera Manager自动部署到集群各节点。
 
$ sudo mkdir -p /opt/cloudera/parcel-repo
- 将文件夹所有者改为Cloudera Manager的运行用户(hadoop)
 
$ sudo chown hadoop:hadoop /opt/cloudera/parcel-repo
- 所有节点间创建parcels文件夹,所有者为Cloudera Manager的运行用户(hadoop)
 
$ sudo mkdir -p /opt/cloudera/parcels
$ sudo chown hadoop:hadoop /opt/cloudera/parcels
在客户端复制CDH到/opt/cloudera/parcel-repo
CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel
CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel.sha1
CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel.sha1重命名为CDH-5.11.1-1.cdh5.11.1.p0.4-trusty.parcel.sha
Cloudera Manager启动
服务端启动
- 为Cloudera Manager Server启动外部数据库postgresql
 
sudo /opt/cloudera-manager/cm-5.11.1/share/cmf/schema/scm_prepare_database.sh postgresql scm scm scm
- 删除/opt/cloudera-manager/cm-5.11.1/etc/default/cloudera-scm-server中的
export CMF_SUDO_CMD=" " - 更改/opt/cloudera-manager/cm-5.11.1/etc/init.d/cloudera-scm-server:
 
USER=hadoop
GROUP=hadoop
- 启动Cloudera Manager服务端
$ sudo /opt/cloudera-manager/cm-5.11.1/etc/init.d/cloudera-scm-server start - 服务端开机自启设置
 
sudo  cp /opt/cloudera-manager/cm-5.11.1/etc/init.d/cloudera-scm-server /etc/init.d/cloudera-scm-server
sudo update-rc.d cloudera-scm-server defaults
客户端启动
- 删除/opt/cloudera-manager/cm-5.11.1/etc/default/cloudera-scm-agent中的
export CMF_SUDO_CMD=" " - 启动Cloudera Manager服务端
$ sudo /opt/cloudera-manager/cm-5.11.1/etc/init.d/cloudera-scm-agent start - 服务端开机自启设置
 
sudo  cp /opt/cloudera-manager/cm-5.11.1/etc/init.d/cloudera-scm-agent /etc/init.d/cloudera-scm-agent
sudo update-rc.d cloudera-scm-agent defaults
安装相关依赖包
sudo apt-get install ant apache2 bash debhelper fuse gcc libfuse2 libsasl2-modules libsasl2-modules-gssapi-mit libsqlite3-0 libssl-dev libxslt1.1 make openssl perl postgresql-client psmisc python-dev python-mysqldb python-psycopg2 python-setuptools rpcbind sed swig zlib1g
CDH部署
- 主节点上访问http://localhost:7180/,输入用户名
admin,密码admin

 - 点击“向集群添加主机”(下图中的是配好之后的可以忽略)

 - 输入所有需要构建集群的节点名称或IP

 - 选定主机构建集群

 - 进入主页面http://192.168.1.110:7180/cmf/home。

 - 为集群Cluster 1添加服务:

 - 为各服务的组件分配节点主机,完成安装。
 
ubuntu14.04, Cloudera Manager 5.11.1, cdh5.11.1 postgresql离线部署的更多相关文章
- CM5.11与CDH5.11安装使用说明
		
1.cdh5 支持jdk7和jdk82.cloudera只支持oracle发布的jdk3.集群中所有主机的jdk版本必须一致4.生态圈中用到的所有组件所依赖的jdk版本必须一致5.cloudera m ...
 - cloudera manager服务迁移(scm数据库在postgresql上,其他amon,rman,oozie,metastore等在mysql上)
		
公司线上大数据集群,之前用的是公有云主机,现在换成了自己idc机房机器,需要服务迁移,已下为测试: 1.备份原postgresql数据库: pg_dump -U scm scm > scm.sq ...
 - 手动安装cloudera manager 5.x(tar包方式)详解
		
官方共给出了3中安装方式:第一种方法必须要求所有机器都能连网,由于最近各种国外的网站被墙的厉害,我尝试了几次各种超时错误,巨耽误时间不说,一旦失败,重装非常痛苦.第二种方法下载很多包.第三种方法对系统 ...
 - 安装CDH5.11.2集群
		
master 192.168.1.30 saver1 192.168.1.40 saver2 192.168.1.50 首先,时间同步 然后,ssh互通 接下来开始: 1.安装MySQL5.6. ...
 - CDH使用秘籍(一):Cloudera Manager和Managed Service的数据库
		
背景 从业务发展需求,大数据平台须要使用spark作为机器学习.数据挖掘.实时计算等工作,所以决定使用Cloudera Manager5.2.0版本号和CDH5. 曾经搭建过Cloudera Mana ...
 - (转)Installing Cloudera Manager and CDH
		
转:https://blog.csdn.net/qq_26222859/article/details/79976506 译自官网: Installing Cloudera Manager and C ...
 - Cloudera Manager安装之利用parcels方式(在线或离线)安装3或4节点集群(包含最新稳定版本或指定版本的安装)(添加服务)(Ubuntu14.04)(五)
		
前期博客 Cloudera Manager安装之Cloudera Manager 5.6.X安装(tar方式.rpm方式和yum方式) (Ubuntu14.04) (三) 如果大家,在启动的时候,比如 ...
 - Cloudera Manager安装之Cloudera Manager安装前准备(Ubuntu14.04)(一)
		
其实,基本思路跟如下差不多,我就不多详细说了,贴出主要图. 博主,我是直接借鉴下面这位博主,来进行安装的!(灰常感谢他们!) 在线和离线安装Cloudera CDH 5.6.0 Cloudera M ...
 - Cloudera Manager安装之Cloudera Manager 5.6.X安装(tar方式、rpm方式和yum方式) (Ubuntu14.04) (三)
		
见 Ubuntu14.04下完美安装cloudermanage多种方式(图文详解)(博主推荐) 欢迎大家,加入我的微信公众号:大数据躺过的坑 免费给分享 同时,大家可以关注我的个人 ...
 
随机推荐
- JAVA 重写equals和重写hashCode
			
面试官可能会问你:“你重写过 hashcode 和 equals 么,为什么重写equals时必须重写hashCode方法?” 首先你需要了解: hashCode()的作用是获取哈希码(散列码) 它实 ...
 - 关于table的td和ul元素li隔行变色的功能实现
			
table元素的td和ul元素li隔行变色的功能实现 利用css控制二者的样式轻松实现隔行换色: 例如:table的css样式控制: table tr td{ background-color:颜 ...
 - https://scrapingclub.com/exercise/basic_captcha/
			
def parse(self, response): # set_cookies = response.headers.getlist("set-cookie").decode(& ...
 - oracle数据库调整字段顺序
			
oracle数据库调整字段顺序 https://blog.csdn.net/xiaobaixie/article/details/77892034
 - LeetCode #001# Two Sum(js描述)
			
索引 思路1:暴力搜索 思路2:聪明一点的搜索 思路3:利用HashMap巧解 问题描述:https://leetcode.com/problems/two-sum/ 思路1:暴力搜索 一个很自然的想 ...
 - 定位bug的基本要求
			
很多人觉得qa只是负责发现问题,这个实在太狭隘了,现代qa除了发现问题这种基本功外,定位问题,提出解决方案,提出预防方案也是要掌握的技能.这里先说定位问题的要求,定位问题要向深入,前提当然是对功能.产 ...
 - Quick Union
			
Quick Union quick union就是快速连接 和quick find相同,也是构建一个数组id[],不过存的值换一种理解: 每个数组内的元素看做一个结点,结点内的值即id[i]看做i的前 ...
 - linux下磁盘查看和分区
			
4.1 df命令 4.2 du命令 4.3/4.4 磁盘分区 df命令df输出磁盘文件系统使用情况: [root@centos ~]# df文件系统 1K-块 已用 可用 已用% 挂载点 /dev/s ...
 - java中什么是泛型
			
一. 泛型概念的提出(为什么需要泛型)? 首先,我们看下下面这段简短的代码: 1 public class GenericTest { 2 3 public static void main(Stri ...
 - Python3 tkinter基础 OptionMenu 将list导入下拉列表中
			
Python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 Conda ...