问题

Python 脚本使用 requests 模块做 HTTP 请求,验证代理 IP 的可用性,速度等。 设定 HTTP 请求的 connect timeoutread response timeout 均为 3 秒,allow_redirects 设定为 False。Linux shell 启动 10 个 Python 进程持续从 Redis 队列中读取数据。监控软件持续获取进程内存信息。多个小时之后出现,极个别进程内存占用量暴增,其余进程内存均处于正常且相等的水平


脚本分析

猜测 Python 脚本出现内存过大问题的可能原因:

  1. 重复,相互引用
  2. 重复实例化
  3. 打开文件数量过多,并且未释放

针对上面猜测的检查方案:

  1. print 打印主函数中的每个对象,在 while 循环中,被引用的次数。结果:无重复引用。
  2. memory_profilerobjgraph 模块输出主函数内存使用情况,连续测试 10K 条IP,未发现内存爆增问题
  3. lsof 命令对比 异常进程与正常进程打开的文件对比,结果:打开文件相同,没有异常。

外部分析

外部分析工具:

  1. strace 跟进进程调用系统调用
  2. lsof 检查进程的开发的句柄,包括文件,网络连接等
  3. tcpdump 抓包,进程网络连接等数据包。

首先 strace 跟踪 Python脚本的系统调用。

正常进程的系统调用是这样的:

gettimeofday({1472383894, 582049}, NULL) = 0

socket(PF_INET, SOCK_STREAM, IPPROTO_TCP) = 4

fcntl(4, F_GETFL) = 0x2 (flags O_RDWR)

fcntl(4, F_SETFL, O_RDWR|O_NONBLOCK) = 0

connect(4, {sa_family=AF_INET, sin_port=htons(7777), sin_addr=inet_addr("123.57.190.51")}, 16) = -1 EINPROGRESS (Operation now in progress)

poll([{fd=4, events=POLLOUT}], 1, 3000) = 1 ([{fd=4, revents=POLLOUT|POLLERR|POLLHUP}])

getsockopt(4, SOL_SOCKET, SO_ERROR, [111], [4]) = 0

close(4) = 0

stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=414, ...}) = 0

select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout)

stat("/root/.netrc", 0x7ffd418e1fe0) = -1 ENOENT (No such file or directory)

stat("/root/_netrc", 0x7ffd418e1fe0) = -1 ENOENT (No such file or directory)

异常进程的系统调用是这样的:

gettimeofday({1472384309, 884266}, NULL) = 0

poll([{fd=4, events=POLLIN}], 1, 3000) = 1 ([{fd=4, revents=POLLIN}])

recvfrom(4, "\22\4p\327\252\313\5opera\20\4x\244)\303\5opera\21\4r}?\265\5o"..., 3907, 0, NULL, NULL) = 1448

gettimeofday({1472384310, 89236}, NULL) = 0

poll([{fd=4, events=POLLIN}], 1, 3000) = 1 ([{fd=4, revents=POLLIN}])

recvfrom(4, "\247p\364\0%\4ry\353\355\4jake\22\4p\327\227b\5opera\22\4\312C("..., 2459, 0, NULL, NULL) = 506

异常进程无休止的系统调用 poll 获取数据,开辟内存使用。初步猜测,TCP连接上有问题。

第二步 lsof 查看异常进程建立的网络连接。

python 12245 root 4u IPv4 9012524 0t0 TCP 10.0.21.226:54452->s30-06-09.opera-mini.net:9000 (ESTABLISHED)

根据 Python脚本的设定,HTTP请求, 连接超时(connect timeout)与读取回复超时 (read response timeout) 都是 3 秒。也就是说一般情况,进程不应该对这个IP(域名)连接了。

在6秒之后,在此查看该进程的 tcp连接,发现已然与此IP建立连接。

思考:为什么 Python requests 模块设定的超时时间无效?

第三步 tcpdump 抓去这个异常进程正在连接的 的数据包。

tcpdump -i eth0 host 107.167.113.32 tcp port 9000 -w /tmp/connect.log

tcpdump 抓到的数据包扔到 WireShake 打开分析。

TCP标志位:ACK 与 PSH。(传输数据)

持续观察之后,确定为特殊IP的特殊端口,在TCP建立连接之后,回传送大量垃圾无用数据。导致极个别进程出现内存异常问题。

另外由于 TCP 层持续传送数据, 经过测试,无论是 urllib2 还是 requests 的超时时间设定对此类问题均无效。


处理方案

思考:

  1. 由于是 TCP 层的连接问题,HTTP层的超时时间对此无效,需要外部对每次多 HTTP 连接作超时处理。
  2. 此脚本行为更多占用的系统 IO 而非 CPU 计算,多进程方案会占用很多内存,Python多线程存在 GIL 问题

方案:

  1. 协程
  2. gevent 模块
  3. gevent.with_timeout(seconds=15, function=worker)
  4. 协程池
from gevent.pool import Pool
worker_poll = Pool(10) # 最大协程数 10

记录特殊情况的Python脚本的内存异常与处理的更多相关文章

  1. 基于binlog来分析mysql的行记录修改情况(python脚本分析)

          最近写完mysql flashback,突然发现还有有这种使用场景:有些情况下,可能会统计在某个时间段内,MySQL修改了多少数据量?发生了多少事务?主要是哪些表格发生变动?变动的数量是怎 ...

  2. Linux服务器CPU、内存、磁盘空间、负载情况查看python脚本

    [本文出自天外归云的博客园] 网上搜,东拼西凑,组装了一个可以查Linux服务器CPU使用率.内存使用率.磁盘空间占用率.负载情况的python脚本. 脚本内容如下: # -*- coding:utf ...

  3. Python脚本控制的WebDriver 常用操作 <十二> send_keys模拟按键输入

    下面将使用WebDriver中的send_keys来模拟键盘按键输入 测试用例场景 send_keys方法可以模拟一些组合键操作: ctrl+a ctrl+c ctrl+v 等. 另外有时候我们需要在 ...

  4. [Java/Python] java调用python脚本问题记录

    Java调用Python的的两种方式 1.Runtime private static String call_python(String input_argv) { String python_py ...

  5. python学习 —— 获取系统运行情况信息并在Linux下设置定时运行python脚本

    代码: # -*- coding:utf-8 -*- from psutil import * def cpu_usage_rate(): for i, j in zip(range(1, cpu_c ...

  6. spark-submit提交python脚本过程记录

    最近刚学习spark,用spark-submit命令提交一个python脚本,一开始老报错,所以打算好好整理一下用spark-submit命令提交python脚本的过程.先看一下spark-submi ...

  7. 用于监视Linux上的内存使用情况的Bash脚本

    用于监视Linux上的内存使用情况的Bash脚本 2019-06-17 11:32:45作者:戴进稿源:云网牛站 在本文中,我们添加了两个shell脚本来监视Linux操作系统上的内存利用率,即用于监 ...

  8. 记录一次坑爹的Python脚本抢购低价手机经历!

    无意间浏览到魅族官网,说魅族3限量100台.30号中午12点抢购.正好我爪机目前处于报废状态,就来一试手气了.11点多种,习惯性的看了下网页脚本,发现了检测是否到抢购时间,并返回抢购消息的ajax.于 ...

  9. c#调用python脚本实现排序(适用于python脚本中不包含第三方模块的情况)

    引用:https://www.cnblogs.com/zoe-yan/p/10374757.html 利用vs2017c#调用python脚本需要安装IronPython.我是通过vs2017的工具- ...

随机推荐

  1. JST(JavaScript Trimpath)前端模板引擎简介

    JST(JavaScript Trimpath)前端模板引擎简介及应用 今天在做某系统日志列表的时候用到了这个玩意儿.刚开始只是根据别人的例子照葫芦画瓢完成了日志列表及对应详情,晚上有空了才仔细去网上 ...

  2. 使用Servlet Filter做Login checking

    1) 建一个Login Servlet: Login.java package com.my; import java.io.*; import javax.servlet.*; import jav ...

  3. 【linux】grub加密

    1.计算grub的MD5加密密码: #grub-md5-crypt Password: Retype password:输入两遍密码进行确认以后,就会计算出你所输入密码的MD5加密值,如:$1$pFd ...

  4. 多线程要点--CLR C#学习笔记

    1.windows永远不会调度一个进程,只调度线程. 2.线程和操作系统的关系:CLR(X)--AppDomain--线程池(包含工作者线程和I/O线程) 3.线程的关键组成部分 A.线程执行上下文 ...

  5. Winform/WPF国际化处理

    1.Winfrom国际化处理方式 ==> Winform中国际化支持可将UI页面和.cs文件分开处理 处理窗体方式如下:1.选择Form窗体设置其--Language(默认中文--Default ...

  6. docker配置环境

    debian: curl -sSL https://get.docker.com/ | sh curl -sSL https://get.daocloud.io/docker | sh daoclou ...

  7. spring2.5

    1:IOC:控制反转,不再把依赖对象交给应用本身创建和维护,而是交给外部容器创建和维护.这样控制权由应用转移到外部容器.2:DI:依赖注入,在运行期,由外部容器动态的将依赖对象注入到组件中,可以通过构 ...

  8. javascript世界一等公民—函数

    简介 在很多传统语言(C/C++/Java/C#等)中,函数都是作为一个二等公民存在,你只能用语言的关键字声明一个函数然后调用它,如果需要把函数作为参数传给另一个函数,或是赋值给一个本地变量,又或是作 ...

  9. [JS]Javascript的this用法

    转自:阮一峰 this是Javascript语言的一个关键字. 它代表函数运行时,自动生成的一个内部对象,只能在函数内部使用.比如, function test(){ this.x = 1; } 随着 ...

  10. 0810HTML(表单)

    图片热点: 规划出图片上的一个区域,可以做出超链接,直接点击图片区域就可以完成跳转的效果. <img src="a006.jpg" title="这是企鹅" ...