[BD] 阿里云部署hadoop集群
安装方式
- rpm包安装:下载rpm文件后离线装,安装过程中会下载相应依赖
- bin文件安装:在线安装
- tar包安装
步骤
- 下载安装文件:买香港机器,按量付费,传到windows电脑
- 购买三台,按需付费,2G 8核
- 开放端口:ECS实例>更多>安全组配置>配置规则
- 关闭selinux:disabled(默认关闭)
- 设置时区:date 查看
- 时间同步(CentOS 7)
- 第一台通过网络同步,第二、三台与第一台同步
- systemctl stop ntpd
- systemctl disable ntpd
- /usr/sbin/ntpdate hadoop001
- crontab -e:00 00 * * * /usr/sbin/ntpdate hadoop001(每天0点同步一次)
- 云主机可不做,非云主机(虚拟机 / 公司内部机器)一定要做
- 安装 jdk
- /usr/java
- 解压之后,修正所属用户及用户组
- chown -R root:root /usr/java/jdk1.8.0_45
- 设置环境变量:scp /etc/profile hadoop002:/etc/
- 离线部署 MySQL
- innodb_buffer_pool_size=2G(生产环境12G)
- jdbc
- 离线部署 CM
- 文件3
- 解压到 mkdir /opt/cloudera-manager
- 修改配置
- agent:hadoop001-hadoop003
- server:hadoop001
- 创建 cloudera-scm
- 修改用户组:chown -R cloudera-scm:cloudera-scm /opt/cloudera-manager
- 离线源部署 Parcel 文件(hadoop001)
- 文件1 2 5
- mkdir -p /opt/cloudera/parcel-repo
- 安装包 mv 到目录,重命名sha去掉1
- 校验文件是否完整(防止网络下载丢包)
- chown -R cloudera-scm:cloudera-scm /opt/cloudera
- 创建目录
- 所有节点创建大数据软件的安装目录,用户和用户组权限
- mkdir -p /opt/cloudera/parcels
- chown -R cloudera-scm:cloudera-scm /opt/cloudera
- 启动 Server 和 agent
- /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-server
- 等待一分钟,看日志是否报错
- /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-agent
- 云主机开启7180端口


检查无误后,可进行具体组件的安装

BIpNgCNrgz
参考
parcel 和 package 安装
https://www.cnblogs.com/yycc/p/7427457.html
CDH 5.16离线部署教程
https://www.bilibili.com/video/av52167219?from=search&seid=17801304070861960646
博客教程
https://blog.csdn.net/byweb/article/details/83685757
https://blog.csdn.net/bingdianone/article/details/87867428
https://developer.aliyun.com/article/622223
https://www.cnblogs.com/yangshibiao/p/10862632.html
https://juejin.im/post/5cee40e66fb9a07f0b03a4ef
官网文档
[BD] 阿里云部署hadoop集群的更多相关文章
- 阿里云搭建hadoop集群服务器,内网、外网访问问题(详解。。。)
这个问题花费了我将近两天的时间,经过多次试错和尝试,现在想分享给大家来解决此问题避免大家入坑,以前都是在局域网上搭建的hadoop集群,并且是局域网访问的,没遇见此问题. 因为阿里云上搭建的hadoo ...
- 阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建
准备: 两台配置CentOS 7.3的阿里云ECS服务器: hadoop-2.7.3.tar.gz安装包: jdk-8u77-linux-x64.tar.gz安装包: hostname及IP的配置: ...
- 阿里云ECS服务器部署HADOOP集群(二):HBase完全分布式集群搭建(使用外置ZooKeeper)
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
- 阿里云ECS服务器部署HADOOP集群(三):ZooKeeper 完全分布式集群搭建
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
- 阿里云ECS服务器部署HADOOP集群(六):Flume 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍 一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
- 阿里云ECS服务器部署HADOOP集群(七):Sqoop 安装
本篇将在 阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建 阿里云ECS服务器部署HADOOP集群(二):HBase完全分布式集群搭建(使用外置ZooKeeper) 阿 ...
- 阿里云ECS服务器部署HADOOP集群(五):Pig 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍 一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
- 阿里云ECS服务器部署HADOOP集群(四):Hive本地模式的安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 本地模式需要采用MySQL数据库存储数据. 1 环境介绍 一台阿里云ECS服务器:master ...
- Docker部署Hadoop集群
Docker部署Hadoop集群 2016-09-27 杜亦舒 前几天写了文章"Hadoop 集群搭建"之后,一个朋友留言说希望介绍下如何使用Docker部署,这个建议很好,Doc ...
随机推荐
- CPU 权限划分
Intel的CPU将特权级别分为4个级别:RING0,RING1,RING2,RING3.Windows只使用其中的两个级别RING0和RING3,RING0只给操作系统用,RING3谁都能用.如果普 ...
- Linux命令的应用
目录 Linux命令 Linux文件管理命令 用户管理 权限管理 vi文本编辑器 find查找命令 磁盘管理命令 压缩及解压 Linux 进程 Linux运行tomcat Linux安装mysql 卸 ...
- [BFS]骑士旅行
骑士旅行 Description 在一个n m 格子的棋盘上,有一只国际象棋的骑士在棋盘的左下角 (1;1)(如图1),骑士只能根据象棋的规则进行移动,要么横向跳动一格纵向跳动两格,要么纵向跳动一格横 ...
- 如何快速创建odoo模块,使用脚手架快速创建自己的odoo应用app
上一篇内容:如何快速搭建自己的ERP系统,4步源码快速安装odoo教程 了解什么是odoo的插件模块 odoo在基础的框架代码之下,可以安装自己的应用程序或者业务逻辑,也可以对原有的模块进行二次修改 ...
- Dapper, Ef core, Freesql 插入大量数据性能比较(一)
需求:导入9999行数据时Dapper, Ef core, Freesql 谁的性能更优,是如何执行的,级联增加谁性能更佳. 确认方法:sql server 的 sys.dm_exec_query_s ...
- Spring MVC(七篇)
(一)Spring MVC简介 (二)SpringMVC核心控制器 (三)Spring MVC Controller接口控制器详解(一) (三)Spring MVC Controller接口控制器详解 ...
- 一文简述JAVA内部类和异常
内部类和异常 内部类 在一个类的内部定义的一个类,例如,A类中定义了一个B类,则B类相对于A类就是内部类,而A类相对于B类就是外部类 成员内部类 静态内部类 局部内部类 匿名内部类 成员内部类 pub ...
- buuctf --pwn part2
pwn难啊! 1.[OGeek2019]babyrop 先check一下文件,开启了NX 在ida中没有找到system.'/bin/sh'等相关的字符,或许需要ROP绕过(废话,题目提示了) 查看到 ...
- redis实际应用-限流
为什么要做限流 首先让我们先看一看系统架构设计中,为什么要做"限流". 旅游景点通常都会有最大的接待量,不可能无限制的放游客进入,比如故宫每天只卖八万张票,超过八万的游客,无法买票 ...
- 一致性哈希做负载均衡,基于dubbo的简化版本,超级简单容易理解!!!
一致性哈希算法原理以及做分布式存储.一定先看:一致性哈希算法 dubbo提供了四种负载均衡实现:权重随机算法,最少活跃调用数算法,一致性哈希算法,加权轮询算法. 本文基于开源项目:guide-rpc- ...