通过Ambari2.2.2部署HDP大数据服务
node1 | amari-server | |
node2 | amari-agent | namenode1,datanode,resourcemanager,zk |
node3 | amari-agent | namenode2,datanode,zk |
官方安装文档:https://cwiki.apache.org/confluence/display/AMBARI/Install+Ambari+2.2.2+from+Public+Repositories
1.关闭防火墙和selinux,配置hosts,配置ssh免密码登录,时间同步,安装好jdk和ntp服务并启动
2.安装yum源和相关软件(在线安装很慢,可以把文件下载下来配置本地yum)
cd /etc/yum.repos.d/
wget http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.2.2.0/ambari.repo
yum install ambari-server postgresql-server #node1执行
3.运行ambari-server setup命令设置Ambari
其他默认
设置JDK时候选择3,然后输入jdk的路径
选择数据库类型时候选择1(可根据自己需求安装其他数据库)
3.1启动Amabri
ambari-server start
成功启动后在浏览器输入nod1:8080,用户名和密码admin
3.2安装jdbc驱动
在 ambari-server 上停止 ambari-server 服务,然后在命令行使用
ambari-server setup --jdbc-db=mysql --jdbc-driver=/root/mysql-connector-java-5.1./mysql-connector-java-5.1.-bin.jar #开始配置 jdbc-driver 连接器
此步操作会完成以下几个步骤:
- 在server本机,会将目标连接器拷贝到 /usr/lib/ambari-server/resources/ 目录中。
- 在集群内的所有成员机中,配置连接器信息。
配置完成后,再启动 ambari-server 服务,即可。
4.开始安装大数据
4.1点击上面登录成功页面的Launch Install Wizard 按钮进行集群配置
4.2版本号选择和操作系统
如果是使用本地yum源:
4.3输入节点名称和选择私钥
4.4会自动安装ambari-agent,然后进行注册,这里可能比较慢
如果遇到错误,按照要求排查
4.5选择要安装的服务
4.6服务的master配置和slave配置,可按需修改
4.7服务的客户化配置,可以根据需求修改
HDP配置lzo
yum -y install lzo lzo-devel hadooplzo hadooplzo-native
找到 Advanced core-site
项,在 io.compression.codecs
的原有value值中添加 com.hadoop.compression.lzo.LzoCodec
找到 Custom core-site
项,添加key为 io.compression.codec.lzo.class
且值为 com.hadoop.compression.lzo.LzoCodec
。
保存配置。 重启集群服务即可。
测试lzo:执行
hbase org.apache.hadoop.hbase.util.CompressionTest hdfs://mycluster/test_lzo lzo
4.8检查配置信息
4.9开始安装
安装各个服务,并且完成安装后会启动相关服务,安装过程比较长,如果中途出现错误,请根据具体提示或者log进行修改
NameNode HA配置
In Ambari Web, select
Services > HDFS > Summary.
Select Service Actions and choose Enable NameNode HA
ResourceManager HA配置
- 可参考 https://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.1/bk_Ambari_Users_Guide/content/_how_to_configure_resourcemanager_high_availability.html
- In Ambari Web, browse to
Services > YARN > Summary
. SelectService Actions
and chooseEnable ResourceManager HA
.
Hbase HA配置
In Ambari Web, browse to
Services > HBase
.In Service Actions, select the
+ Add HBase Master
option.Choose the host to install the additional HBase Master, then choose Confirm Add.
Hive HA配置
In Ambari Web, browse to
Services > Hive
.In Service Actions, select the
+ Add Hive Metastore
option.Choose the host to install the additional Hive Metastore, then choose Confirm Add.
- Ambari installs the component and reconfigures Hive to handle multiple Hive Metastore instances.
参考:
http://www.jianshu.com/p/6e59df5f2461
http://blog.csdn.net/daiyutage/article/details/52210830
https://my.oschina.net/wstone/blog/521987
http://www.ibm.com/developerworks/cn/opensource/os-cn-bigdata-ambari/
http://www.linuxidc.com/Linux/2014-12/110824.htm
离线安装:
http://www.itweet.cn/2015/08/31/hdp-install/
通过Ambari2.2.2部署HDP大数据服务的更多相关文章
- 大数据服务大比拼:AWS VS. AzureVS.谷歌
[TechTarget中国原创] 对于企业用户来说,大数据服务是一项较具吸引力的云服务.三大巨头AWS.Azure以及谷歌都在力争夺得头把交椅,但是最后到底是哪一家能够取得王座之战的胜利呢? 云市场正 ...
- MaxCompute,基于Serverless的高可用大数据服务
摘要:2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的“阿里云栖开发者沙龙大数据技术专场”走近北京联合大学,本次技术沙龙上,阿里巴巴高级技术专家吴永明为大家分享了 ...
- InfoQ —— 腾讯游戏大数据服务场景与应用
简介 周东祥,本人从2010年毕业进入腾讯互动娱乐部门工作,一直致力在腾讯游戏运营开发工作.先后负责SAP业务受理系统,盗号自助系统,元数据系统以及近2年在腾讯游戏大数据运营开发中积累大量的大数据开发 ...
- HDP 大数据平台搭建
一.概述 Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应.管理和监控的开源工具,Ambari已支持大多数Hadoop组件,包括HDFS.MapReduce.Hiv ...
- 我的ElasticSearch集群部署总结--大数据搜索引擎你不得不知
摘要:世上有三类书籍:1.介绍知识,2.阐述理论,3.工具书:世间也存在两类知识:1.技术,2.思想.以下是我在部署ElasticSearch集群时的经验总结,它们大体属于第一类知识“techknow ...
- 三分钟部署Laxcus大数据管理系统
Laxcus是Laxcus大数据实验室历时五年,全体系自主设计研发的国内首套大数据管理系统.能够支撑百万台级计算机节点,提供EB量级存储和计算能力,兼容SQL和关系数据库.最新的2.x版本已经实现对当 ...
- IT大数据服务管理高级课程(IT服务,大数据,云计算,智能城市)
个人简历 金石先生是马克思主义中国化的研究学者,上海财经大学经济学和管理学硕士,中国民主建国会成员,中国特色社会主义人文科技管理哲学的理论奠基人之一.金石先生博学多才,对问题有独到见解.专于工作且乐于 ...
- Windows Azure上的大数据服务: HDInsight的介绍
这个视频介绍了目前非常流行的大数据处理框架Hadoop的Windows Azure上的实现:HDInsight,以及利用MapReduce来对大数据进行分析,利用Hive进行查询,利用客户端Power ...
- 卸载HDP大数据平台
使用以下说明卸载HDP: 停止所有已安装的HDP服务.请参阅HDP参考指南中的停止HDP服务. 如果安装了Knox,请在所有群集节点上运行以下命令: 对于RHEL / CentOS / Oracle ...
随机推荐
- 介绍一款web端的截图工具
牛牛截图,web端的一款截图工具,下面是代码及实例. 依赖jquery-1.7.min.js /**************************************************** ...
- Git 基本知识与常用指令
一.Git代码状态转换图 其中: 未被Git跟踪的状态为unstage状态: 已被Git跟踪的状态为stage状态(stage:阶段),因此包括staging状态和staged状态. untrack ...
- Hadoop的安装与配置(虚拟机中的伪分布模式)
1引言 hadoop如今已经成为大数据处理中不可缺少的关键技术,在如今大数据爆炸的时代,hadoop给我们处理海量数据提供了强有力的技术支撑.因此,了解hadoop的原理与应用方法是必要的技术知识. ...
- 【Linux】Linux入门及常见基本操作命令详解
本文基于 Red Hat Enterprise Linux 6 一.Linux 入门体验 1.1 root用户登陆 1.2 图形化与纯字符模式切换 init 5 - 图形模式 init 3 - 纯字符 ...
- Python的线程池实现
# -*- coding: utf-8 -*- #Python的线程池实现 import Queue import threading import sys import time import ur ...
- 1.appium介绍
appium介绍 官方网站 1.特点 appium 是一个自动化测试开源工具,支持 iOS 平台和 Android 平台上的原生应用,web应用和混合应用. “移动原生应用”是指那些用iOS或者 An ...
- OFFICE_EXCEL_Combine text from two or more cells into one cell.
Excel Enter and format data Layout Combine text from two or more cells into one cell Combine t ...
- JsonResponse、FileResponse和StreamingHttpResponse
一.JsonResponse对象 class JsonResponse(data,encoder=DjangoJSONEncoder,safe=True,json_dumps_params=None, ...
- ftp免交互上传文件脚本
ftp -i -n <<! open .x.x.x user yourFtpAccount yourPasswd cd /root/DailyBuild/webapps/ delete x ...
- c++11之100行实现简单线程池
代码从github上拷的,写了一些理解,如有错误请指正 Threadpool.h #ifndef THREAD_POOL_H #define THREAD_POOL_H #include <ve ...