本文主要阐述大数据平台环境zookeeper常见异常和解决方案

1.Connection reset by peer异常

异常说明

我们现在项目有个任务OneMinuteDataSync是用spark将实时数据同步插入到hbase中，程序已经稳定运行很长一段时间，不过最近数据量增加比较多，任务运行一段时间后，突然僵死几个小时后，有恢复正常继续运行，如下图，任务正常运行情况下耗时15s左右，但2017-07-11 04:33:00这个批次运行了9486s,而凌晨数据量很少的，才13w左右，白天峰值稳定在45w左右。

查看该任务的运行的worker节点的日志，发现zoookeeper connection reset by peer异常日志

解决方案

首先查询zookeeper日志，只发现了Too many connectionn 警告

由于刚开始的时候zookeeper zoo.cfg没有配置maxClientCnxns参数，而zookeeper默认配置为60，即单个客户端与单台服务器之间的连接数的限制，而我们前几天才升级hbase和zookeeper集群，已经将

maxClientCnxns=300

而对于单台服务器来说，300个连接我们认为已经足够使用。我们在30.27.96.14上查看2181端口的连接情况

netstat -anp | grep 

netstat -anp | grep  | wc

发现实际上状态为ESTABLISHED的连接只有不到10个，而状态为TIME_WAIT的连接有几百个，而TIME_WAIT状态实际上是客户端建立连接，完成任务后正常断开连接后的状态，其他状态解释如下：

CLOSED：无连接是活动的或正在进行
LISTEN：服务器在等待进入呼叫
SYN_RECV：一个连接请求已经到达，等待确认
SYN_SENT：应用已经开始，打开一个连接
ESTABLISHED：正常数据传输状态
FIN_WAIT1：应用说它已经完成
FIN_WAIT2：另一边已同意释放
ITMED_WAIT：等待所有分组死掉
CLOSING：两边同时尝试关闭
TIME_WAIT：另一边已初始化一个释放
LAST_ACK：等待所有分组死掉

更加详细的内容要去阅读TCP协议。而我们现在要解决的是连接正常关闭后，尽快减少TIME_WAIT状态的连接，最后我们通过修改Linux内核参数来减少服务器的TIME_WAIT套接字数量，步骤如下：

#.切换到root用户
su root

#.更改sysctl.conf配置，增加如下两行配置
vi /etc/sysctl.conf
net.ipv4.tcp_tw_reuse=
##表示开启重用。允许将TIME_WAIT套接字重新用于新的TCP连接。默认为0，表示关闭。

net.ipv4.tcp_tw_recycle=
##表示开启TCP连接中TIME_WAIT套接字的快速回收。默认为0，表示关闭

#.让配置立即生效
 /sbin/sysctl -p

更改spark集群服务器配置后，目前程序运行正常，后续继续观察。

大数据平台常见异常-zookeeper的更多相关文章

时间序列大数据平台建设(Time Series Data，简称TSD)
来源:https://blog.csdn.net/bluishglc/article/details/79277455 引言在大数据的生态系统里,时间序列数据(Time Series Data,简称T ...
基于Ambari构建自己的大数据平台产品
目前市场上常见的企业级大数据平台型的产品主流的有两个,一个是Cloudera公司推出的CDH,一个是Hortonworks公司推出的一套HDP,其中HDP是以开源的Ambari作为一个管理监控工具,C ...
如何基于Go搭建一个大数据平台
如何基于Go搭建一个大数据平台 - Go中国 - CSDN博客 https://blog.csdn.net/ra681t58cjxsgckj31/article/details/78333775 01 ...
CentOS7部署CDH6.0.1大数据平台
Cloudera’s Distribution Including Apache Hadoop,简称“CDH”,基于Web的用户界面,支持大多数Hadoop组件,包括HDFS.MapReduce.Hi ...
Kafka 集群在马蜂窝大数据平台的优化与应用扩展
马蜂窝技术原创文章,更多干货请订阅公众号:mfwtech Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数 ...
大数据平台迁移实践 | Apache DolphinScheduler 在当贝大数据环境中的应用
大家下午好,我是来自当贝网络科技大数据平台的基础开发工程师王昱翔,感谢社区的邀请来参与这次分享,关于 Apache DolphinScheduler 在当贝网络科技大数据环境中的应用. 本次演讲主要 ...
基于Hadoop的大数据平台实施记——整体架构设计[转]
http://blog.csdn.net/jacktan/article/details/9200979 大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底 ...
基于Hadoop的大数据平台实施记——整体架构设计
大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底是否适用于您的组织,至少在互联网上已经被吹嘘成无所不能的超级战舰.好像一夜之间我们就从互联网时代跳跃进了大 ...
Spark大型项目实战：电商用户行为分析大数据平台
本项目主要讲解了一套应用于互联网电商企业中,使用Java.Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为.页面跳转行为.购物行为.广告点击行为等)进行复杂的分析.用统计分 ...

随机推荐

浅谈 Java 主流开源类库解析 XML
在大型项目编码推进中,涉及到 XML 解析问题时,大多数程序员都不太会选用底层的解析方式直接编码. 主要存在编码复杂性.难扩展.难复用....,但如果你是 super 程序员或是一个人的项目,也不妨一 ...
使用Charles Proxy提升iOS开发效率
以前做前端开发的时候,使用最多的工具就是 Fiddler ,用来定位问题.模拟特定场景非常方便,极大提升了开发效率.而转做 iOS 开发以后,一大头疼的问题是 Fiddler 没有 Mac 版,幸亏找 ...
OVS + dpdk 安装与实验环境配置
***DPDK datapath的OVS的安装与实验环境配置首先肯定是DPDK的安装 0:安装必要的工具 make gcc ...
c++概括
c++到底是什么样的语言在过去的几十年,计算机技术的发展令人吃惊,当前的笔记本电脑的计算速度和存储信息的能力超过了20世纪60年代的大型机.20世纪七十年代,C和Pascal语言引领人们进入结构化编 ...
使用 libdvm.so 内部函数dvm* 加载 dex
首先要清楚,odex只是对代码段(我将dex文件与elf文件类比,大家都将执行文件分成不同的段)作优化,而其它用于类反射信息的段都应用原来的dex,所以odex文件内部还包含了一个dex. 打开一个d ...
laravel中的多对多关系详解
数据表之间是纵横交叉.相互关联的,laravel的一对一,一对多比较好理解,官网介绍滴很详细了,在此我就不赘述啦,重点我记下多对多的关系一种常见的关联关系是多对多,即表A的某条记录通过中间表C与表B ...
抓包工具 - HttpWatch
HttpWatch是功能强大的网页数据分析工具,集成在IE工具栏,主要功能有网页摘要.cookies管理.缓存管理.消息头发送/接收,字符查询.POST数据.目录管理功能和报告输出.HttpWatch ...
使用Windows Server 2012+ 搭建VPN 简单高效稳定
前几天,在机缘巧合之下,买到了一台性能配置一般的腾讯云服务器(香港的),因为性能比较差,没啥太大用途,就想着试试搭建一个VPN,后来,经过多次尝试和查资料,总结出了一套几乎100%成功的教程,现在拿来 ...
java基础（九章）
一.理解查询的机制客户端应用程序(c/s.b/s)向后台服务器的DB发送一条select语句进行查询操作,会将结果集(虚拟表)返回到客户端应用程序二.select语句 1.查询表中的全部列和行 s ...
oracle日期时间函数总结
表中存在伪列:sysdate,systimestamp 伪列存在但是不显示 select sysdate from dual; select systimestamp from dual; 日期计算公 ...

大数据平台常见异常-zookeeper

1.Connection reset by peer异常

大数据平台常见异常-zookeeper的更多相关文章

随机推荐

热门专题