在一台服务器上搭建相对高可用HiveServer实践

本文来自网易云社区

作者：刘杰

问题及原因

组里之前搭建了一个hiveserver提供给猛犸上的ETL程序调用，hiveserver隔三差五地挂掉重启，网上查了些资料，也咨询了猛犸那边维护hiveserver周全同学，这是一个比较普遍的问题，原因基本上都是进程内存用爆引发的hiveserver奔溃，内存爆掉的原因大概有两个：

hiveserver2会加载大量的元数据，元数据多了，内存就oom了
连接hiverserver2的sql性能慢，查询时间超长，占用大量内存

解决方法

目前内存爆掉没有太好的解决方法，一般的解决方法监控和重启，使用探针程序定时监测hiveserver是否工作，如果不工作就重启。另外启动多个hiveserver，使用HA工具进行切换，本文中采用HAProxy，HAProxy是一个开源的HA工具，可以工作在TCP层和HTTP层。

实践方案

软硬件配置

16G内存服务器一台
Hive客户端
HAProxy

 ##使用不同的端口启动三个hiveserverhiveserver2 --hiveconf hive.server2.thrift.port=10000 &

hiveserver2 --hiveconf hive.server2.thrift.port=10001 &

hiveserver2 --hiveconf hive.server2.thrift.port=10004 &

##crontab定时执行的检查程序##探针程序，每分钟执行一次，检查hiveserver是否运行正常，任意执行一个sql即可，如果不工作了就重启java -jar HiveserverState-jar-with-dependencies.jar -Dport=10000if [ $? -ne 0 ]then##内存监控重定向到文件，查看hiveserver挂的那个时刻内存的快照ps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf 

hive.server2.thrift.port=10000" | grep -v grep | awk '{print $2}'  | xargs jstat -gcutil >> mem_stat.log

ps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf hive.server2.thrift.port=10000" | grep -v grep | awk '{print $2}'  | xargs kill -9nohup hiveserver2 --hiveconf hive.server2.thrift.port=10000 &echo 'restart Hiveserver 10000 端口成功'fijava -jar HiveserverState-jar-with-dependencies.jar -Dport=10001if [ $? -ne 0 ]thenps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf hive.server2.thrift.port=10001" | grep -v grep | awk '{print $2}'  | xargs jstat -gcutil >> mem_stat.log

ps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf hive.server2.thrift.port=10001" | grep -v grep | awk '{print $2}' | xargs kill -9nohup hiveserver2 --hiveconf hive.server2.thrift.port=10001 &echo 'restart Hiveserver 10001 端口成功'fijava -jar HiveserverState-jar-with-dependencies.jar -Dport=10004if [ $? -ne 0 ]thenps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf hive.server2.thrift.port=10004" | grep -v grep | awk '{print $2}'  | xargs jstat -gcutil >> mem_stat.log

ps -ef|grep "org.apache.hive.service.server.HiveServer2 --hiveconf hive.server2.thrift.port=10004" | grep -v grep | awk '{print $2}' | xargs kill -9nohup hiveserver2 --hiveconf hive.server2.thrift.port=10004 &echo 'restart Hiveserver 10004 端口成功'fi

HA配置如下

listen hive             #hive后端定义

        bind 0.0.0.0:10003              #ha作为proxy所绑定的IP和端口

        mode tcp                        #以4层方式代理，重要

        balance leastconn               #调度算法 'leastconn' 最少连接数分配，或者 'roundrobin'，轮询分配

        maxconn 10240                    #最大连接数

        server hive_1 server_ip:10000 check inter 180000 rise 1 fall 2

        server hive_2 server_ip:10001 check inter 180000 rise 1 fall 2

        server hive_3 server_ip:10004 check inter 180000 rise 1 fall 2

问题及改进

以上方法搭建的hiveserver只是相对高可用，应对组内的ETL任务已经足够了。因为只有一台机器，所以存在单点故障，在实际生产环境中，可以使用两台机器作为HAProxy，另外三台作为hiveserver。

作者

刘杰
谢非

参考文章

http://lanlian.blog.51cto.com/6790106/1305228

http://www.cnblogs.com/smartloli/p/4368676.html

网易云大礼包：https://www.163yun.com/gift

本文来自网易云社区，经作者刘杰授权发布

相关文章：
【推荐】 Hi，这有一份风控体系建设干货
【推荐】【专家坐堂】四种并发编程模型简介

在一台服务器上搭建相对高可用HiveServer实践的更多相关文章

在一台服务器上搭建多个网站的方法（Apache版）
Apache的配置文件一般放置在/etc/httpd/conf文件夹下,httpd.conf是它的主配置文件,在进行配置时可以将虚拟主机的配置文件单独配置,如取名为vhost.conf,然后再http ...
基于CentOS 8服务器来搭建FastDFS高可用集群环境
服务器版本我们在服务器的命令行输入如下命令来查看服务器的内核版本. [root@localhost lib]# cat /etc/redhat-release CentOS Linux releas ...
在一台服务器上搭建多个项目的SVN
需求:一台机子,多个项目,项目之间用户独立不可以相互访问文件思路:在机子上设置多个代码仓库,用不同的端口号加一区分实现: 首先安装SVN,我这里使用的是TortoiseSVN 首先创建多个SVN代 ...
【MySQL】一台服务器上搭建两个mysql节点
环境: CentOS 6.8 memory:1G Mysql 5.7 二进制安装包 1.安装相关的环境包 yum -y install gcc glibc libaio libstdc++ libs ...
Microsoft Dynamics CRM 2011 面向Internet部署 (IFD) ADFS虚拟机环境搭建的步骤(CRM与ADFS装在同一台服务器上) 摘自网络
1: 安装windows server 2008 R2 中文版 (过程略) 安装完成后设置机器名和IP地址, 本过程机器名 crm5dev,192.168.0.110 dns: 192.168.0.1 ...
阿里云ECS服务器上搭建keepalived+mha+mysql5.6+gtid+一主两从+脚本判断架构踩的坑
最近,公司项目搭建了一套后端数据库架构,不是在RDS,是在阿里云的ECS服务器上搭建keepalived.mha.mysql5.6.gtid.一主两从架构,目前还没有实现读写分离,以后架构升级,可能代 ...
用Docker在一台笔记本电脑上搭建一个具有10个节点7种角色的Hadoop集群（上）-快速上手Docker
如果想在一台电脑上搭建一个多节点的Hadoop集群,传统的方式是使用多个虚拟机.但这种方式占用的资源比较多,一台笔记本能同时运行的虚拟机的数量是很有限的.这个时候我们可以使用Docker.Docker ...
从零开始搭建高性能高可用Tomcat服务器
目标: Tomcat+Nginx+Memcached Ubuntu 16.04 64位测试通过动静分类.负载均衡.集群.Javolution序列化.高性能.高可用配置环境(目前均为最新稳定版): ...
服务器上的 Git - 在服务器上搭建 Git
http://git-scm.com/book/zh/v2/%E6%9C%8D%E5%8A%A1%E5%99%A8%E4%B8%8A%E7%9A%84-Git-%E5%9C%A8%E6%9C%8D%E ...

随机推荐

批处理文件中获取当前所在路径的几种方法，以及写文件到txt
@echo off setlocal EnableDelayedExpansion echo 当前正在运行的批处理文件所在路径:!cd! pause @echo off echo 当前目录是:%cd% ...
dart 公共变量
dart中可以直接在一个文件里声明一个变量,这在其他语言中并不常见,比如c#语言只有类型才可以在命名空间下定义,变量必须放在类里声明所以dart这点特性类似于js 今天就来讨论这个公共变量的作用范围 ...
Zabbix Agent 自动、主动注册
简述: 今天来研究一下 Zabbix 的主动注册功能. 当你有十台机器需要监控时,你手动去添加是没有问题的.但是当你有五十台.上百台或更多服务器要监控时,你会怎么做 ? Active Agent Au ...
【306】通过ArcPy编写ArcToolbox
参考:使用 Python 创建工具参考:在 Python 工具箱中定义参数数据类型基本步骤如下: (1)创建一个 Python 脚本,并保存成 .py 文件. (2)创建一个自定义工具箱(.tbx ...
redis cluster test
cp /test/tests/redis.conf /etc redis-server /etc/redis.conf redis-trib.rb create --replicas 1 172.17 ...
Linux实战教学笔记14:用户管理初级（上）
第十四节用户管理初级(上) 标签(空格分隔): Linux实战教学笔记-陈思齐 ---更多资料点我查看 1,账号管理 1.1 管理用户命令汇总命令注释说明(特殊颜色的必须掌握) useradd增 ...
消息队列—ActiveMQ
1. 学习计划 1.什么是MQ 2.MQ的应用场景 3.ActiveMQ的使用方法. 4.使用消息队列实现商品同步. 2. 同步索引库分析方案一:在manager(后台)中,添加商品的业务逻 ...
java算法第七届蓝桥杯B组（题+答案） 1.煤球数目
1.煤球数目 (结果填空) 有一堆煤球,堆成三角棱锥形.具体:第一层放1个,第二层3个(排列成三角形),第三层6个(排列成三角形),第四层10个(排列成三角形),....如果一共有100层,共有多少 ...
03.什么是Lucene全文检索的原理01
全文检索的原理:查询速度快,精准度高,可以根据相关度进行排序.它的原理是:先把内容分词,分词之后建索引. Lucene是apache下的一个开放源代码的全文检索引擎工具包. 提供了完整的查询引擎和索引 ...
【UVA1515 算法竞赛入门指南】水塘【最小割】
题意: 输入一个h行w列的字符矩阵,草地用“#”表示,洞用"."表示.你可以把草改成洞,每格花费为d,也可以把洞填上草,每格花费为f.最后还需要在草和洞之间修围栏,每条边花费为b. ...