关于一次配合开发工作而产生的服务器内核参数问题(Android 网络问题)
关于一次配合开发工作而产生的服务器内核参数问题(Android 网络问题)
问题转载(本人与作者遇到了同样的问题)
问题描述
问题描述:在这几年的Android开发中,遇到了一个困扰我好久的问题,有时候在公司的wifi下,请求我们的公司自己的服务器很慢,甚至经常请求失败,切换成移动网络3G或者4G,就明显变快。but在相同的wifi环境下,用iphone和电脑请求就很快
刚开始发现手机wifi很慢的时候,以为是公司网络的问题,所以找运维去解决,运维的解释是我们公司用的北京鹏博士的宽带,公司机房是用的北京联通的宽带,公司的网络连接公司的服务器要经过武汉的转接点才能连到公司的服务器,绕了一个大圈,导致请求变慢,解决方法是接入多个运营商,但是由于公司预算的问题,这个没法解决。
后来发现只有Android手机连接服务器比较慢,iPhone和windows电脑请求都正常,我猜想可能是应用的网络请求框架有问题,因此专门写了一个demo,用Android提供的HttpUrlConnection直接请求,然后又用系统浏览器直接请求接口,也有同样的问题,排除了框架问题的可能。
难道是Android手机的wifi模块质量比较次,所以我把手头所有Android手机都测试了一遍,不管是贵的,还是便宜的,可能爆炸的还是工匠精神的都有此问题,并且还发现在家里的wifi下速度嗖嗖的。所以wifi模块的问题也排除了。
后来又想难道是发送出去的数据有问题,所以我就开始用Fiddler抓包,然后发现只要通过代理,将App代理到公司电脑上,在公司wifi下,连接很顺畅,后来又特意用手机做了一个热点,共享wifi到另一台手机,也很顺畅/
至此,因为水平有限,所有能试的方法都用了,没有定位到原因,这个问题也就搁置了。后来有一天研究okhttp,看到复用连接池,突然想到会不会跟这个原因有关呢,想要看连接有没有被复用,就要开始对Android手机进行抓包,并且不能通过代理的方式抓包,要直接抓包,抓包方法:http://blog.csdn.net/jk38687587/article/details/48467329
抓包测试
安装好抓包工具后,开始对手机进行抓包,通过和电脑直接请求的包进行对比,发现手机wifi下,Tcp Retransmission的情况很多,如图所示

丢包截图
这是什么鬼,SYN是什么玩意儿,ACK是啥,好吧,先恶补一下TCP/IP协议,然后谷歌一下,说是在第一次握手(SYN)的时候网络请求超时重发,但是为什么会超时呢,如果网络不好为什么windows下的请求就不超时呢?再仔细对比两边发出去数据包,发现Android发出去的包比windows发出去的包多了个timestamps字段,查查这个是什么玩意儿,查到了http://blog.csdn.net/jueshengtianya/article/details/50440696,有可能时间戳可能会导致客户端访问不了服务器。
有两种解决方案:
一种是将服务器的时间戳net.ipv4.tcp_timestamps设置为0
另一种是该客户端,将时间戳关闭,服务器咱改不了,先改改客户端吧,客户端怎么改呀,在寻找答案的过程中还发现了有人跟我遇到过同样的问题Android之网络丢包事件,我先试着用Root Explorer修改/proc/sys/net/ipv4文件夹下的tcp_timestamps文件(在这里遇到一个坑,以为可以直接编辑修改,废了好大劲也没修改成功,以为是root不彻底,鼓捣了半天root,也没成功,后来发现必须要通过命令才能修改,详见:http://blog.csdn.net/apn172/article/details/8034240)
先将timestamps设置为0,

timestamps设置为0
抓包显示

ts0.png

tsd0.png
timestamps没有了,效果立显,所有的重发都没有了
再设置回去:

抓包显示

ts1.png

tsd1.png
问题又出现了,来回试了几十遍,确认就是这个参数的问题。好有成就感呀。
但是这个问题最终的解决方案还得服务器改,因为客户端改这个参数要root,所以经过跟运维的同学沟通,将服务器的net.ipv4.tcp_timestamps设置为0和1,分别验证效果,结果很明显,就是这个参数的问题,最终服务器的同学将这个参数设置为了0,至此,困扰了我好久的问题终于得到了解决!!!
事后,查了一下tcp_timestamps的相关资料,了解了一下RFC1323协议,在linux中如果是tcp_tw_recycle被打开了话,会假设对端开启了 tcp_timestamps,然后会去比较时间戳,如果时间戳变大了,就可以重用。tcp_timestamps记录的是从开机到现在所经过的秒数,tcp_tw_recycle在开启后会比较同一公网ip下的tcp_timestamps,所以在同一wifi下,在第一次SYN的时候,tcp_timestamps如果比其他设备的tcp_timestamps小的话,包就直接被丢弃。
针对服务器方面来说开启timestamps参数有助于防御DDOS攻击

关于内核参数的优化,在/etc/sysctl.conf 文件内
1)timewait的数量,默认是180000.(Deven:因此如果想把timewait下降就要把tcp_max_tw_buckets值减小)
net.ipv4.tcp_max_tw_buckets = 6000
2)允许系统打开的端口范围
net.ipv4.ip_local_port_range = 1024 65000
3)启用TIEM_WAIT状态sockets快速回收功能,用于快速简述在TIME-WAIT状态TCP连接数。1表示启动;0表示关闭,但是要特别留意的是:这个状态一般不推荐启用,因为在NAT(Network Address Translation)网络下,会导致大量的TCP链接错误,从而引起网站访问故障。
net.ipv4.tcp_tw_recycle = 0
实际上,net.ipv4.tcp_tw_recycle功能的开启,需要net.ipv4.tcp_timestamps(一般系统默认是开启这个功能的)这个开关开启后才有效果;当tcp_tw_recycle开启是(tcp_timestamps同时开启,快速回收socket的效果达到),对于位于NAT设备后面的Client来说,是一场灾难!也就是说tcp_tw_recycle这个功能,是为内部网络(网络环境自己可控“” 不存在NAT的情况)设计的,对于公网环境下,不宜使用。
通常来说,回收TIME_WAIT状态的socket是因为”无法主动链接远端“,因为无可用的端口,而不应该是要回收内存(没有必要)
即,需求是Client的需求,Server会有“端口不够用”的问题吗?
除非是前端机,需要大量的链接后端服务,也就是充当着Client的角色。
参考:
关于一次配合开发工作而产生的服务器内核参数问题(Android 网络问题)的更多相关文章
- Git代码分支开发工作流程
本文的工作流程,有一个共同点:都采用"功能驱动式开发"(Feature-driven development,简称FDD). 它指的是,需求是开发的起点,先有需求再有功能分支(fe ...
- Outfit7 庆祝其开发工作大获丰收
走不寻常路之经验总结 每位合格应用开发人员都拥有相同的目标:灵机一动,构建独创性原型,克服各种困难,最终吸引投资者将其想法推向市场. 名声.财富以及构建更多应用的机会将接踵而至. 焦虑.改善和重复是开 ...
- fir.im Weekly - 聊聊让人向往的远程开发工作
6月30 日,苹果开发者后台贴出一封关于广电总局的醒目通知,申报一个游戏 APP 上架AppStore,你需要文网文+ICP证+软著+版号,审批难度将越来越大,不禁让人感慨中国独立开发者的成长 &qu ...
- 开发工作之外的修炼Live笔记
“开发工作之外的修炼”这期Live分享了下列话题: [1] 如何发现自己的兴趣 [2] 财富.资源与被动收入 [3] 目标管理 [4] 快速做选择 [5] 时间管理 [6] 如何投资自己 >&g ...
- Java后端开发工作 - 写接口
我在公司的工作内容是,对于一个BS应用,负责服务器端开发工作,Java语言.与前端开发人员合作,最终提供给前端RESTFUL接口,保证页面正常响应. 经验之谈 一个接口可以理解为一个业务逻辑,一个业务 ...
- BMDP为常规的统计分析提供了大量的完备的函数系统,如:方差分析(ANOVA)、回归分析(Regression)、非参数分析(Nonparametric Analysis)、时间序列(Times Series)等等。此外,BMDP特别擅于进行出色的生存分析(Survival Analysis )。许多年来,一大批世界范围内顶级的统计学家都曾今参与过BMDP的开发工作。这不仅使得BMDP的权威性得到
BMDP是Bio Medical Data Processing的缩写,是世界级的统计工具软件,至今已经有40多年的历史.目前在国际上与SAS.SPSS被并称为三大统计软件包.BMDP是一个大 ...
- Java2年开发工作经验面试总结
Java2年开发工作经验面试总结最近换了个公司,从二月底开始面,面到三月底,面了有快二十五家公司.我是一个喜欢总结经验的人,每经过一场面试,我在回来的路上都会仔细回想今天哪些问题可以答的更好,或者哪些 ...
- js--前端开发工作中常见的时间处理问题
前言 在前端开发工作中,服务端返回的时间数据或者你传递给服务端的时间参数经常会遇到时间格式转换及处理问题.这里分享一些我收集到的一些处理方法,方便日后工作中快速找到.先附上必须了解的知识内置对象传送门 ...
- 零基础,三个月内,找到??? java后端开发工作
一.分析你的问题 出于尊重,先分析一下你的原问题吧,从您的问题,我提取到关键信息:"零基础"."三个月内"."找到工作",最后一个关键词&q ...
随机推荐
- front-end & web & best code editor
front-end & web & best code editor 2019 VS Code https://designrevision.com/best-code-editor/ ...
- Google IO & 2019
Google IO & 2019 Google IO Recap \ https://www.techradar.com/news/google-io-2019-keynote https:/ ...
- TypeScript 3.7 RC & Assertion Functions
TypeScript 3.7 RC & Assertion Functions assertion functions, assert https://devblogs.microsoft.c ...
- ng 基础
文档 组件的工作只管用户体验,而不用顾及其它. 它应该提供用于数据绑定的属性和方法,以便作为视图和应用逻辑的中介者 组件应该把诸如从服务器获取数据.验证用户输入或直接往控制台中写日志等工作委托给各种服 ...
- Python3+PYQT5 实现并打包exe小工具(2)
前言:前篇已经通过python代码实现了逻辑,传送门:https://www.cnblogs.com/jc-home/p/14447850.html 现在后篇记录的是打包成exe的方式给项目其他同事使 ...
- JavaSE实现IoC
作者:Grey 原文地址: 语雀 博客园 Java SE 提供了三种方式,可以实现IoC,分别为: Java Beans Java ServiceLoader SPI JNDI(Java Naming ...
- 第31天学习打卡(File类。字符流读写文件)
File类 概念 文件,文件夹,一个file对象代表磁盘上的某个文件或者文件夹 构造方法 File(String pathname) File(String parent,String child) ...
- POJ-3080(KMP+多个字符串的最长公共子串)
Blue Jeans HDOJ-3080 本题使用的是KMP算法加暴力解决 首先枚举第一个字符串的所有子串,复杂度为O(60*60),随后再将每个子串和所有剩下的m-1个字符串比较,看是否存在这个子串 ...
- 【白话科普】CDN & 游戏加速器,两者是一个原理吗?
说起加速,大家可能就会联想到"游戏加速"之类的场景,而说到现在流行的云服务加速,则离不开 CDN 这个词.那么 CDN 和游戏加速器是同一种东西么?从效果上看两者都是为了" ...
- 2020年12月-第02阶段-前端基础-CSS Day03
CSS Day03 盒子模型(CSS重点) css学习三大重点: css 盒子模型 . 浮动 . 定位 主题思路: 理解: 1.能说出盒子模型有那四部分组成 2.能说出内边距的作用以及对盒子的影响 3 ...