TCP重传率高的监控】的更多相关文章

TCP重传率是对网络质量的一个体现,简单包装netstat -s的输出可以计算出TCP重传率.现成的脚本如下: #!/bin/bash export PATH='/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin' SHELLDIR="$( cd "$( dirname "${BASH_SOURCE[0]}" )" && pwd )" netstat -s -t…
网络不稳定,会导致某些核的软中断很高么?那么,下面我们来分析下这个论断的准确性. 环境描述: 网卡软中断进行了绑核.设备具备80个核,960个网卡中断,没开启bbr,全部是tcp呼叫. # cat /proc/cpuinfo |grep processor|wc -l # cat /proc/interrupts |grep eth |wc -l # /smp_affinity ,,,,,, 每个网卡中断指定在一个cpu核上. 问题描述:发现有的核上软中断比其他核高很多,因为当时看到有大概2个点…
http://blog.sina.com.cn/s/blog_4d276ac901011ee7.html ——TCM项目所得 一.看图说话 1.基于套接字的TCP服务器/客户端程序流程 2.TCP三次握手建立连接 3.TCP四次交互断开连接 4.TCP状态转移图 这张图看不懂的话解释在计算机网络第四版P274.解释下MSL:最长分节生存周期,他代表了IP数据报载网络上的最长生命周期.保证该连接上的数据包在网络中全部消失. 二.TCP重传 1.重传的原因 1)发端计时器超时 TCP每发送一个报文段…
TCP的错误恢复特性是我们用来定位.诊断并最终修复网络高延迟的最好工具. 常见的TCP错误恢复特性有:TCP重传.TCP重复确认和快速重传 1. TCP重传: 重传数据包是TCP最基本的错误恢复特性之一,用来对付数据包的丢失. 数据包丢失可能原因有很多,如:出故障的应用程序.流量负载沉重的路由器或临时性的服务中断. 数据包层次上的移动速度非常快,而且数据包丢失通常都是暂时的,因此TCP能否检测到数据包丢失并恢复至关重要. 如何决定是否重传: 决定是否重传数据包的主要机制叫做:重传计时器,这个计时…
在最开始介绍TCP的时候,我们就介绍了TCP的三个特点,分别是面向连接.可靠.字节流式.前面内容我们已经介绍过了TCP的连接管理,接下来的这部分内容将会介绍与TCP可靠性强关联的TCP重传. 很多网络协议都提供了checksum或者CRC手段来检测收到的数据包是否发生错误,但是检测到数据包错误后很多协议都不会进行重传等操作来可靠的修复错误.例如常见的IP和UDP协议完全没有重传,对于链路层的以太网协议,虽然有重传操作但是尝试若干次重传还没有成功会也会放弃(CSMA/CD) 经过N多专家前扑后继的…
作为网络管理员,很多时间必然会耗费在修复慢速服务器和其他终端.但用户感到网络运行缓慢并不意味着就是网络问题. 解决网络性能问题,首先从TCP错误恢复功能(TCP重传与重复ACK)和流控功能说起.之后阐述如何发现网络慢速之源.最后,对网络各组成部分上的数据流进行概况分析.这几张内容将会帮助读者识别,诊断,以及排查慢速网络. 更多信息接下来的内容,较多是黑白图片了.虽然看起来有点不爽,但还是很值得一看. TCP错误恢复功能: TCP的错误恢复功能是定位,诊断及修复网络延时的最佳工具.延时可以在单程也…
原文出处: EMC中文支持论坛 作为网络管理员,很多时间必然会耗费在修复慢速服务器和其他终端.但用户感到网络运行缓慢并不意味着就是网络问题. 解决网络性能问题,首先从TCP错误恢复功能(TCP重传与重复ACK)和流控功能说起.之后阐述如何发现网络慢速之源.最后,对网络各组成部分上的数据流进行概况分析.这几张内容将会帮助读者识别,诊断,以及排查慢速网络. 更多信息 接下来的内容,较多是黑白图片了.虽然看起来有点不爽,但还是很值得一看. TCP错误恢复功能: TCP的错误恢复功能是定位,诊断及修复网…
处理线上问题经常会碰到网络抖动的情况, 网络抖动有可能就是TCP重传导致,下面简单说下TCP重传的排查思路,不一定能完全解决问题 1. 找运维同事确定是否是网线问题, 如果是网线问题请更换网线 2. 使用ping 确定是不是网络问题, 通常系统自带的ping命令是走ICMP协议,这个是基于IP层的协议,和tcp协议是同一级别的,所以我们还需要使用 tcp协议的ping, tcp协议的ping我可以使用下面的脚本进行测试. 下载地址: http://pan.baidu.com/s/1dFFsich…
之前对tcp的监控采用netstat命令,发现在服务器繁忙的时候效果不理想,这个命令占用大量的cpu有时候高达90%以上,可能会导致业务的不稳定,所以改用ss命令对脚本进行优化 对tcp连接数和状态的监控意义主要有以下几点: 可以观察服务器的压力分布(连接数大于5W的时候可能系统会有一定的压力,可以考虑加服务器) 如果服务器的连接数突然变得极小(比如100以下),可能是业务系统故障导致在线用户被踢出 脚本编写 在需要被监控的zabbix-agent端添加脚本编写 创建文件夹 mkdir -p /…
zabbix3.0对tcp连接数及状态的监控优化 之前对tcp的监控采用netstat命令,发现在服务器繁忙的时候效果不理想,这个命令占用大量的cpu有时候高达90%以上,可能会导致业务的不稳定,所以改用ss命令对脚本进行优化 在需要被监控的zabbix-agent端添加脚本编写 创建文件夹 mkdir -p /usr/local/zabbix-agent/scripts/ mkdir -p /etc/zabbix/zabbix_agentd.d/ vim /usr/local/zabbix-a…