[BD] 阿里云部署hadoop集群
安装方式
- rpm包安装:下载rpm文件后离线装,安装过程中会下载相应依赖
- bin文件安装:在线安装
- tar包安装
步骤
- 下载安装文件:买香港机器,按量付费,传到windows电脑
- 购买三台,按需付费,2G 8核
- 开放端口:ECS实例>更多>安全组配置>配置规则
- 关闭selinux:disabled(默认关闭)
- 设置时区:date 查看
- 时间同步(CentOS 7)
- 第一台通过网络同步,第二、三台与第一台同步
- systemctl stop ntpd
- systemctl disable ntpd
- /usr/sbin/ntpdate hadoop001
- crontab -e:00 00 * * * /usr/sbin/ntpdate hadoop001(每天0点同步一次)
- 云主机可不做,非云主机(虚拟机 / 公司内部机器)一定要做
- 安装 jdk
- /usr/java
- 解压之后,修正所属用户及用户组
- chown -R root:root /usr/java/jdk1.8.0_45
- 设置环境变量:scp /etc/profile hadoop002:/etc/
- 离线部署 MySQL
- innodb_buffer_pool_size=2G(生产环境12G)
- jdbc
- 离线部署 CM
- 文件3
- 解压到 mkdir /opt/cloudera-manager
- 修改配置
- agent:hadoop001-hadoop003
- server:hadoop001
- 创建 cloudera-scm
- 修改用户组:chown -R cloudera-scm:cloudera-scm /opt/cloudera-manager
- 离线源部署 Parcel 文件(hadoop001)
- 文件1 2 5
- mkdir -p /opt/cloudera/parcel-repo
- 安装包 mv 到目录,重命名sha去掉1
- 校验文件是否完整(防止网络下载丢包)
- chown -R cloudera-scm:cloudera-scm /opt/cloudera
- 创建目录
- 所有节点创建大数据软件的安装目录,用户和用户组权限
- mkdir -p /opt/cloudera/parcels
- chown -R cloudera-scm:cloudera-scm /opt/cloudera
- 启动 Server 和 agent
- /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-server
- 等待一分钟,看日志是否报错
- /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-agent
- 云主机开启7180端口
检查无误后,可进行具体组件的安装
BIpNgCNrgz
参考
parcel 和 package 安装
https://www.cnblogs.com/yycc/p/7427457.html
CDH 5.16离线部署教程
https://www.bilibili.com/video/av52167219?from=search&seid=17801304070861960646
博客教程
https://blog.csdn.net/byweb/article/details/83685757
https://blog.csdn.net/bingdianone/article/details/87867428
https://developer.aliyun.com/article/622223
https://www.cnblogs.com/yangshibiao/p/10862632.html
https://juejin.im/post/5cee40e66fb9a07f0b03a4ef
官网文档
[BD] 阿里云部署hadoop集群的更多相关文章
- 阿里云搭建hadoop集群服务器,内网、外网访问问题(详解。。。)
这个问题花费了我将近两天的时间,经过多次试错和尝试,现在想分享给大家来解决此问题避免大家入坑,以前都是在局域网上搭建的hadoop集群,并且是局域网访问的,没遇见此问题. 因为阿里云上搭建的hadoo ...
- 阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建
准备: 两台配置CentOS 7.3的阿里云ECS服务器: hadoop-2.7.3.tar.gz安装包: jdk-8u77-linux-x64.tar.gz安装包: hostname及IP的配置: ...
- 阿里云ECS服务器部署HADOOP集群(二):HBase完全分布式集群搭建(使用外置ZooKeeper)
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
- 阿里云ECS服务器部署HADOOP集群(三):ZooKeeper 完全分布式集群搭建
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
- 阿里云ECS服务器部署HADOOP集群(六):Flume 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍 一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
- 阿里云ECS服务器部署HADOOP集群(七):Sqoop 安装
本篇将在 阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建 阿里云ECS服务器部署HADOOP集群(二):HBase完全分布式集群搭建(使用外置ZooKeeper) 阿 ...
- 阿里云ECS服务器部署HADOOP集群(五):Pig 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍 一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
- 阿里云ECS服务器部署HADOOP集群(四):Hive本地模式的安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 本地模式需要采用MySQL数据库存储数据. 1 环境介绍 一台阿里云ECS服务器:master ...
- Docker部署Hadoop集群
Docker部署Hadoop集群 2016-09-27 杜亦舒 前几天写了文章"Hadoop 集群搭建"之后,一个朋友留言说希望介绍下如何使用Docker部署,这个建议很好,Doc ...
随机推荐
- 利用别名切换索引流程Elasticsearch 7.7
背景 公司里面现在有es集群,由于时间过长,es集群中的某个索引过大但是未删除,一直在写入的情况下,昨天写入突然停止了,发现是索引超时的问题,这时想到通过创建一个新的索引来进行索引切换 操作 es 集 ...
- js 更改json的 key
let t = data.map(item => { return{ fee: item['费用'], companyName1: item.companyName, remark1: item ...
- BUAA_OS lab4 难点梳理
BUAA_OS lab4 难点梳理 lab4体会到了OS难度的飞升.实验需要掌握的重点有以下: 系统调用流程 进程通信机制 fork 本lab理解难度较高,接下来将以以上三部分分别梳理. 系统调用 概 ...
- 翻译:《实用的Python编程》09_01_Packages
目录| 上一节 (8.3 调试) | 下一节 (9.2 第三方包) 9.1 包 如果编写一个较大的程序,我们并不真的想在顶层将其组织为一个个独立文件的大型集合.本节对包(package)进行介绍. 模 ...
- 重磅:谷歌强势回归! google大会报名
google退出中国已经很久了,有关google回归的消息也流传了很久,今天,我们迎来了回归的开幕式. 1.中国区开发者网站 不需要梯子,赶紧取感受下吧: https://developers.goo ...
- java面试一日一题:mysql中常用的存储引擎有哪些?
问题:请讲下mysql中常用的引擎有哪些? 分析:该问题主要考察对mysql存储引擎的理解,及区别是什么? 回答要点: 主要从以下几点去考虑, 1.mysql的存储引擎的基本概念? 2.mysql中常 ...
- Object.assign()和解构赋值:给对象赋值的两种方法
一.Object.assign()方法给对象赋值 Object.assign() 方法用于将所有可枚举属性的值从一个或多个源对象分配到目标对象.它将返回目标对象. 拷贝的是属性值 如果目标对象中的属性 ...
- linux下Mysql 8.0.19 编译安装
1 前言 linux下安装MySQL的方式有很多种,包括以仓库的方式安装(yum,apt,zypper),以包的方式安装(rpm,deb),以docker方式安装,从压缩包解压安装,从源码编译安装,这 ...
- Java多线程编程(同步、死锁、生产消费者问题)
Java多线程编程(同步.死锁.生产消费): 关于线程同步以及死锁问题: 线程同步概念:是指若干个线程对象并行进行资源的访问时实现的资源处理保护操作: 线程死锁概念:是指两个线程都在等待对方先完成,造 ...
- Day16_88_通过反射机制执行方法
通过反射机制执行方法 * method.invoke(object,"admin","123"); * 代码 import java.lang.reflect. ...