大数据开源平台CDH 集群(CM6.3.1 + CDH 6.3.2)的部署
一,概述
我依照博文:https://www.cnblogs.com/liugp/p/16286645.html ,进行了CDH集群的部署。总体来说,基本比较顺利。
在部署过程中,发生了一些小问题。本文以原博主的步骤 进行说明,详细说明我在部署过程中遇到的问题以及解决方法。
l
二,机器环境配置
以下步骤默认为集群内每个机器进行配置。单独为master机器的配置将另行标明。
1、机器信息
2、修改主机名
这一步应该配置主机名为“全限定主机名( fully qualified domain name (FQDN) )” ,比如 foo-1.example.com 。随后,可添加“非全限定名称” :foo-1
sudo hostnamectl set-hostname foo-1.example.com
配置FQDN, 后续在 CM安装web “配置主机”页面上,可以主动搜寻到“受管机器” 。
在这一步之后,我增加了一个步骤:
2.1 配置 /etc/sysconfig/network 文件, 使用“全限定名”。
HOSTNAME=foo-1.example.com
3、配置/etc/hosts , 举例如下
1.1.1.1 foo-1.example.com foo-1
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3
4、关掉防火墙
5、禁用SELINUX
6、时间同步
7、安装python
8、端口
9、配置免密登录
9、安装JDK
10、交换分区和大页设置
三, 安装CM前期准备
1、组件版本
2、安装Mysql(CDH master节点)
3、为 Cloudera 各软件创建数据库(CDH master节点)
4、安装 MySQL JDBC
三, 安装 CM Server 和 CM Agent
原博客:5、启动CM服务(CM节点)
$ systemctl start cloudera-scm-server
$ systemctl status cloudera-scm-server
$ jps
# 会启动端口7180的服务,服务启动有点慢,需要等待一段时间
netstat -tnlp|grep 7180
# 日志目录:/var/log/cloudera-scm-server/
可以通过日志,查看启动情况,如果有异常,可以定位问题。
sudo tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log
当出现:INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server. 表示启动成功。
四,通过CM web安装CDH 6.3.2
原博客第4步 : 选择集群机器:
如果之前没有配置“全限定机器名” ,“当前管理的机器” 不能找到集群内节点机器,并且要求你再次安装 cloudera-manager-agent
五,补充:下载发布一个Parcels本地仓库
以上步骤已经完成了集群部署。我这里补充下,官方文档里下载发布一个本地仓库的步骤。
1,下载和发布Parcels 本地仓库。(CM master机器)
注意:cloudera 官方软件库已经不支持下载,需要付费。(文件夹:/var/www/html/cloudera-repos 为本地仓库目录)
sudo mkdir -p /var/www/html/cloudera-repos
sudo wget --recursive --no-parent --no-host-directories https://USERNAME:PASSWORD@archive.cloudera.com/p/cdh6/CDH version/parcels/ -P /var/www/html/cloudera-repos
sudo wget --recursive --no-parent --no-host-directories https://USERNAME:PASSWORD@archive.cloudera.com/gplextras6/CDH version/parcels/ -P /var/www/html/cloudera-repos
sudo chmod -R ugo+rX /var/www/html/cloudera-repos/cdh6
sudo chmod -R ugo+rX /var/www/html/cloudera-repos/gplextras6
2,使用一个本地Parcels 本地仓库
2.1,进入 Cloudera Manager Admin 控制web页面,找到Parcels 页面。
2.2,在配置页面,配置本地Parcles路径;
2.3, 回到本地机器(CM master机器)Parcles路径下, 为你的Parcels创建一个 SHA1 哈希文件。举例:parcels为 CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel
sha1sum CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel | awk '{ print $1 }' > CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel.sha
2.4,最后页面点击“ 检查确认新的 Parcels” 文件。
参考:
1,大数据Hadoop之——Cloudera Hadoop(CM 6.3.1+CDH 6.3.2)环境部署
大数据开源平台CDH 集群(CM6.3.1 + CDH 6.3.2)的部署的更多相关文章
- 大数据【一】集群配置及ssh免密认证
八月迷情,这个月会对大数据进行一个快速的了解学习. 一.所需工具简介 首先我是在大数据实验一体机上进行集群管理学习,管理五台实验机,分别为master,slave1,slave2,slave3,cli ...
- 大数据: 完全分布式Hadoop集群-HBase安装
HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境. 本文基 ...
- 大数据 -- zookeeper和kafka集群环境搭建
一 运行环境 从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
- 大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
- 【大数据系列】hadoop集群设置官方文档翻译
Hadoop Cluster Setup Purpose Prerequisites Installation Configuring Hadoop in Non-Secure Mode Config ...
- 大数据之Linux服务器集群搭建
之前写过一篇关于Linux服务器系统的安装与网关的配置,那么现在我们要进一步的搭建多台Linux服务器集群. 关于单台服务器的系统搭建配置就不在赘述了,详情见https://www.cnblogs.c ...
- 【大数据系列】hadoop集群的配置
一.hadoop的配置文件分类 1.只读类型的默认文件 core-default.xml hdfs-default.xml mapred-default.xml mapred-que ...
- 大数据学习——hadoop2.x集群搭建
1.准备Linux环境 1.0先将虚拟机的网络模式选为NAT 1.1修改主机名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=itcast ### ...
- CDH集群安装&测试总结
0.绪论 之前完全没有接触过大数据相关的东西,都是书上啊,媒体上各种吹嘘啊,我对大数据,集群啊,分布式计算等等概念真是高山仰止,充满了仰望之情,觉得这些东西是这样的: 当我搭建的过程中,发现这些东西是 ...
- Cloudera Manager安装_搭建CDH集群
2017年2月22日, 星期三 Cloudera Manager安装_搭建CDH集群 cpu 内存16G 内存12G 内存8G 默认单核单线 CDH1_node9 Server || Agent ...
随机推荐
- spring中Utils工具类注入问题
使用工具类的时候,我们想在static修饰的方法中,通过注入来调用其他方法,这里就存在问题. 第一:普通工具类是不在spring的管理下,spring不会依赖注入 第二:即便使用@Autowired完 ...
- 计算机网络基础07 DNS概述
1 什么是DNS Domain Name System(域名系统),它是一个应用层的服务.它作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便地访问互联网.当前,对于每一级域名长度的限制是 ...
- Idea移除和删除模块
移除:右键模块-remove moduel 删除:在移除操作后 右键模块-delete 然后删除项目pom文件里面的<moduel>
- 【Oculus Interaction SDK】(九)使用控制器时显示手的模型
前言 这篇文章是[Oculus Interaction SDK]系列的一部分,如果发现有对不上的对方,可以回去翻看我之前发布的文章,或在评论区留言.如果文章的内容已经不适用于新版本了,也可以直接联系我 ...
- MySQL数据库报1055错误
有点坑啊,当初装MySQL数据库的时候没有整配置文件,结果MySQL报1055错误的时候,网上的解决办法都说如果需要永久生效的话,只能通过改配置文件实现,but,我没有配置文件,蜜汁尴尬啊 1.已安装 ...
- esp32 开发资料
开发工具下载 https://dl.espressif.cn/dl/esp-idf/ 设置芯片型号等 Windows 平台工具链的标准设置 - ESP32-C3 - - ESP-IDF 编程指南 la ...
- 推荐系统[二]:召回算法超详细讲解[召回模型演化过程、召回模型主流常见算法(DeepMF_TDM_Airbnb Embedding_Item2vec等)、召回路径简介、多路召回融合]
1.前言:召回排序流程策略算法简介 推荐可分为以下四个流程,分别是召回.粗排.精排以及重排: 召回是源头,在某种意义上决定着整个推荐的天花板: 粗排是初筛,一般不会上复杂模型: 精排是整个推荐环节的重 ...
- JZOJ 2020.07.27【NOIP提高组】模拟
总结 今天的题还好,不幸拿了 \(rank1\),只有 \(380pts\) 实际 \(AK\) 也不难 前三题都是思维题 后面一题其实不过是简单的数据结构优化 \(dp\) 的题 用 \(GSM\) ...
- JZOJ 5451.Genocide
题目 题解 对于 \(m=1\) 这档分 我们可以 \(dp\) 然后斜率优化 具体来说就是 \(f_i = f_j + \frac{(i-j)\times (i-j+1)}{2} + sum[j]- ...
- 双端队列xLIS问题
题目大意 有 \(N\) 个数 \(A_i\) ,他准备将他们依次插入一个双端队列(每次可以在头或尾插入一个元素),最后将 整个队列从尾到头看成一个序列,求出最长上升子序列的长度 .他想知道 , \( ...