一,概述

我依照博文:https://www.cnblogs.com/liugp/p/16286645.html ,进行了CDH集群的部署。总体来说,基本比较顺利。

在部署过程中,发生了一些小问题。本文以原博主的步骤 进行说明,详细说明我在部署过程中遇到的问题以及解决方法。

l

二,机器环境配置

以下步骤默认为集群内每个机器进行配置。单独为master机器的配置将另行标明。

1、机器信息
2、修改主机名

这一步应该配置主机名为“全限定主机名( fully qualified domain name (FQDN) )” ,比如 foo-1.example.com  。随后,可添加“非全限定名称” :foo-1

sudo hostnamectl set-hostname foo-1.example.com

配置FQDN, 后续在 CM安装web  “配置主机”页面上,可以主动搜寻到“受管机器” 。

在这一步之后,我增加了一个步骤:

2.1 配置 /etc/sysconfig/network 文件, 使用“全限定名”。

HOSTNAME=foo-1.example.com

3、配置/etc/hosts , 举例如下

1.1.1.1  foo-1.example.com  foo-1
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3

4、关掉防火墙
5、禁用SELINUX
6、时间同步
7、安装python
8、端口
9、配置免密登录
9、安装JDK
10、交换分区和大页设置

三, 安装CM前期准备

1、组件版本
2、安装Mysql(CDH master节点)
3、为 Cloudera 各软件创建数据库(CDH master节点)
4、安装 MySQL JDBC

三, 安装 CM Server 和 CM Agent

原博客:5、启动CM服务(CM节点)

$ systemctl start cloudera-scm-server
$ systemctl status cloudera-scm-server
$ jps
# 会启动端口7180的服务,服务启动有点慢,需要等待一段时间
netstat -tnlp|grep 7180
# 日志目录:/var/log/cloudera-scm-server/

可以通过日志,查看启动情况,如果有异常,可以定位问题。

sudo tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

当出现:INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server.  表示启动成功。

四,通过CM web安装CDH 6.3.2

原博客第4步 : 选择集群机器:

如果之前没有配置“全限定机器名” ,“当前管理的机器” 不能找到集群内节点机器,并且要求你再次安装 cloudera-manager-agent

五,补充:下载发布一个Parcels本地仓库

以上步骤已经完成了集群部署。我这里补充下,官方文档里下载发布一个本地仓库的步骤。

1,下载和发布Parcels 本地仓库。(CM master机器)

注意:cloudera 官方软件库已经不支持下载,需要付费。(文件夹:/var/www/html/cloudera-repos  为本地仓库目录)

sudo mkdir -p /var/www/html/cloudera-repos
sudo wget --recursive --no-parent --no-host-directories https://USERNAME:PASSWORD@archive.cloudera.com/p/cdh6/CDH version/parcels/ -P /var/www/html/cloudera-repos
sudo wget --recursive --no-parent --no-host-directories https://USERNAME:PASSWORD@archive.cloudera.com/gplextras6/CDH version/parcels/ -P /var/www/html/cloudera-repos
sudo chmod -R ugo+rX /var/www/html/cloudera-repos/cdh6
sudo chmod -R ugo+rX /var/www/html/cloudera-repos/gplextras6

2,使用一个本地Parcels 本地仓库

2.1,进入 Cloudera Manager Admin 控制web页面,找到Parcels 页面。

2.2,在配置页面,配置本地Parcles路径;

2.3, 回到本地机器(CM master机器)Parcles路径下,   为你的Parcels创建一个 SHA1  哈希文件。举例:parcels为 CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel

sha1sum CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel | awk '{ print $1 }' > CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel.sha

2.4,最后页面点击“ 检查确认新的 Parcels” 文件。

  

参考:

1,大数据Hadoop之——Cloudera Hadoop(CM 6.3.1+CDH 6.3.2)环境部署

2,cloudera 官方文档

大数据开源平台CDH 集群(CM6.3.1 + CDH 6.3.2)的部署的更多相关文章

  1. 大数据【一】集群配置及ssh免密认证

    八月迷情,这个月会对大数据进行一个快速的了解学习. 一.所需工具简介 首先我是在大数据实验一体机上进行集群管理学习,管理五台实验机,分别为master,slave1,slave2,slave3,cli ...

  2. 大数据: 完全分布式Hadoop集群-HBase安装

            HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境.   本文基 ...

  3. 大数据 -- zookeeper和kafka集群环境搭建

    一 运行环境 从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...

  4. 大数据学习之hdfs集群安装部署04

    1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...

  5. 【大数据系列】hadoop集群设置官方文档翻译

    Hadoop Cluster Setup Purpose Prerequisites Installation Configuring Hadoop in Non-Secure Mode Config ...

  6. 大数据之Linux服务器集群搭建

    之前写过一篇关于Linux服务器系统的安装与网关的配置,那么现在我们要进一步的搭建多台Linux服务器集群. 关于单台服务器的系统搭建配置就不在赘述了,详情见https://www.cnblogs.c ...

  7. 【大数据系列】hadoop集群的配置

    一.hadoop的配置文件分类 1.只读类型的默认文件 core-default.xml     hdfs-default.xml    mapred-default.xml   mapred-que ...

  8. 大数据学习——hadoop2.x集群搭建

    1.准备Linux环境 1.0先将虚拟机的网络模式选为NAT 1.1修改主机名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=itcast ### ...

  9. CDH集群安装&测试总结

    0.绪论 之前完全没有接触过大数据相关的东西,都是书上啊,媒体上各种吹嘘啊,我对大数据,集群啊,分布式计算等等概念真是高山仰止,充满了仰望之情,觉得这些东西是这样的: 当我搭建的过程中,发现这些东西是 ...

  10. Cloudera Manager安装_搭建CDH集群

    2017年2月22日, 星期三 Cloudera Manager安装_搭建CDH集群 cpu   内存16G 内存12G 内存8G 默认单核单线 CDH1_node9 Server  || Agent ...

随机推荐

  1. ArcGIS for Android 开发环境搭建

    ArcGIS for Android 开发环境搭建 1. 基础环境搭建 1.1. 安装JDK 安装JDK8,并设置环境变量 在cmd窗口输入java -version检查是否配置完成 java -ve ...

  2. Solon2 的应用生命周期

    Solon 框架的应用生命周期包括:一个初始化函数时机点 + 六个事件时机点 + 两个插件生命时机点 + 两个容器生命时机点(v2.2.0 版本的状态): 提醒: 启动过程完成后,项目才能正常运行(启 ...

  3. TCP怎样保证可靠传输

    TCP的可靠性保证 TCP主要提供了检验和,序列号/确认应答,超时重传,最大消息长度,滑动窗口控制等方法实现了可靠性传输. 检验和 通过检验和的方式,接收端可以检测出来数据是否有差错和异常,假如有差错 ...

  4. 淘宝sign算法和使用教程

    前言 最新写的淘宝热卖插件系列里面有涉及到淘宝sign算法加密,这里博主分享一下之前找到算法和修改后的算法以及使用教程.在此希望能帮助更多的人,欢迎各位加入我的交流Q群:468458543,群内不定时 ...

  5. 以图搜图功能实现(windows10版)

    1,原理 存储:通过Core项目调取python接口,python通过使用towhee把图片转成向量存在milvus向量数据库中. 查询:通过Core项目调取python接口,python根据查询的图 ...

  6. 四点DLT (Direct Linear Transformation) 算法

    \(\mathrm{x}_{i}\) 表示变化前的齐次坐标 \(\mathbf{x}_{i}^{\prime}\) 表示变化后的齐次坐标 我们需要求到一个 \(3\times3\) 的变换矩阵 \(\ ...

  7. 2021.09 ccf csp 第四题 收集卡牌

    2021.09 ccf csp 第四题 收集卡牌 思路 这题如果直接计算,因为不同的分类种数太多,枚举所有的分类情况是一个几乎不可能的复杂任务. 但不同摸牌次数,不同已摸出牌种类的子问题的答案之间,具 ...

  8. pyinstaller打包后运行提示“No module named 'PyQt5' "

    记录遇到的一个很傻的问题 脚本用到了PyQt5模块,安装成功脚本可以正常运行,但是使用pyinstaller 打包后,运行 exe文件提示 No module named 'PyQt5' 原因: 因为 ...

  9. python实现PDF指定页面旋转

    下面示例代码,是将横向纸张旋转为纵向(根据纸张大小判断纸张方向) 方法一:使用PyPDF2库 from PyPDF2 import PdfFileWriter, PdfFileReader def p ...

  10. 001.shell-每日练习一文件创建

    001.shell-每日练习一文件创建 0x00.练习要求 在/usr/local/uz654目录下,按照xxxx-xx-xx生成一个文件,如:2023-02-11.log 把磁盘的使用情况写到这个文 ...