PHP 教你使用 Swoole-Tracker 秒级定位 PHP 卡死问题
PHPer 肯定收到过这样的投诉:小菊花一直在转!你们网站怎么这么卡!当我们线上业务遇到这种卡住(阻塞)的情况,大部分 PHPer 会两眼一抹黑,随后想起那句名言:性能瓶颈都在数据库
然后把锅甩给DBA,赶紧找找慢sql,但这是非常错误的做法,因为有太多因素能导致业务卡住,下面列举几种常见的卡住问题。
1.死循环
最常见的就是写出了死循环代码
<?php while(1){ //do something if($condition){ //满足条件后退出循环 break; } }
上述代码通过$condition
控制循环退出,如果程序验证不严格,某些情况$condition
永远为真就会导致请求卡死。
2.sesstion_start函数导致卡死
PHP的session锁等待(ps:很多地方叫做session死锁,这不太符合死锁定义),这个相信大部分PHPer都遇到过,PHP默认会把session信息存储在/tmp/sess_
下面的session文件里面,调用session_start()
函数的时候会调用flock
系统调用给session文件加锁,如果前一个请求没有结束或者手动释放session就会导致后面的请求无法获得锁,卡死在session_start()
这个地方。下面举个例子,比如这种代码:
setInterval(function () { $.post("/ajax/doSomething", {}, function (result) {//1s进行一次ajax }); }, 1000)//1000ms == 1s
前端js定时通过ajax请求一下后端PHP的接口(/ajax/doSomething
)做一些比较耗时的事情,写代码的人可能想当然的认为第一次的请求即使没有处理完,也不会影响第二次的请求,因为有很多的FPM进程每次请求会分发到不通的进程,但殊不知第二次请求会卡死在session_start()
。
3.flock函数导致卡死
最常见的场景就是写日志,在PHP代码中确保每次fwrite
写的日志内容小于8k的情况下我们可以利用append原子追加方式写日志,但是如果保证不了小于8k我们就需要在每次写日志前给文件加文件锁来避免两次日志间产生穿插的情况,代码如下:
<?php $fp = fopen("/home/guoxinhua/php.log", "a+"); if (flock($fp, LOCK_EX)) { //给日志文件加锁 //do something fwrite($fp, "the huge string\n"); flock($fp, LOCK_UN); // 释放锁定 }
如果在A进程获得锁后由于某种问题阻塞了那么B进程就会卡死在第三行flock
的位置,除非A进程被kill掉,系统会自动释放这个文件锁
注意还有很多其他类型的锁即使进程被kill也不会自动被释放。
这个8k是可以改的,和glibc中的fwrite很多细节也不一样.
4. 网络客户端未设置超时时间
MySQL、CURL、Swoole\Client 等网络客户端未设置超时可能会导致进程阻塞。Swoole\Client 建立 TCP 连接的时候connect
方法的最后一个参数是超时时间,-1
即为永不超时,注意这里设置不是单指这次connect
方法,而是后面所有的send
,recv
都永不超时,在同步阻塞的编程模式下,如果此时对端机器直接宕机等原因导致网络不通,那么本端业务的表现就是卡死状态,所有的send
,recv
方法都将被阻塞,代码如下:
<?php $cli = new Swoole\Client(SWOOLE_SOCK_TCP); if ($cli->connect('127.0.0.1', 9501,-1)) { $cli->send("data"); $cli->recv(); } else { echo "connect failed."; }
5. Swoole协程的lock
在 Swoole 协程模式下,不正确的使用lock也会导致所有协程大面积卡死,如下代码,通过go
方法创建2个协程(不理解协程的同学可以理解为创建了2个线程),第一个协程lock获得锁后在co::sleep
位置让出了cpu此时开始执行第二个协程,第二个协程会卡死在第6行获得锁的位置,同时第一个协程也永远无法恢复继续执行。
<?php $lock = new Swoole\Lock(); $c = 2;//创建2个协程 while ($c--) { go(function () use ($lock) {//创建协程 $lock->lock();//获得锁 Co::sleep(1);//让出cpu $lock->unlock();//释放锁 }); }
如何发现卡死
上述只是举了一些例子,真实业务中还有各种姿势的卡死,遇到这种问题有经验的PHPer会用strace -p
命令查看当前PHP进程到底阻塞在哪个系统调用上面来定位问题,但这种方式有几个问题:
- 定位问题不清晰
比如死锁这种问题strace的时候只能看到类似futex(0x7f4c8d567128, FUTEX_WAIT, 2, NULL)
这种信息,非常的不直观,很多人根本不知道哪些PHP代码会触发futex
系统调用,还有前文提到session_start
那个问题,很多人根本不知道这里会触发flock
,也就说很难根据一个系统调用定位到具体问题。 - 不知道-p哪一个进程
我们线上环境通常会启动几十个甚至上百个PHP进程,在有些请求卡死,有些请求正常的情况下,你到底该strace -p
哪个进程呢?貌似只能碰碰运气了。 - 发现不了死循环的问题
由于strace
命令的原理是追踪所有的系统调用,如果是前文提到的第一种情况,也就是死循环的卡死,strace
根本无法获得任何有用的信息。此时我们只能用gdb
工具来获取当前死循环在哪里具体,具体做法如下:首先:gdb attach
后面接个进程id。
然后:p (char *)executor_globals.current_execute_data.func.op_array.filename.val
打印当前执行的PHP文件。p (char *)executor_globals.current_execute_data.func.op_array.function_name.val
打印当前执行的函数名。p executor_globals.current_execute_data.opline.lineno
打印当前执行的行数。
进一步也可以获取调用堆栈这里就不展开了。
但这明显太底层了,很多细节要注意,不精通PHP内核的人很难这样找问题(ps:通过.gdbinit
能稍微减少点难度,但是也有很多其他问题)。
使用 Swoole Tracker 发现卡死问题
针对上述问题,Swoole官方出了一个解决方案 Swoole Tracker 的堆栈工具,同时支持FPM和Swoole。
使用方法很简单:
- 首先点击上面的连接注册个账户。
- 然后装上
swoole_tracker
扩展。 - 最后登陆后台,在
调试器
=>进程列表
中点击堆栈
按钮就能获得当前卡在哪了,如图:
结尾
除了上面的卡死问题,还有一种情况是调用变慢,比如原来一个系统调用5ms,但是由于网络等等原因,这个调用100ms才返回,业务的表现是变慢了而不是卡死在那里,这种情况通过tracker的抓堆栈工具是无法定位问题的,因为卡住时间很短,很难抓到调用堆栈,此时需要Swoole工具链中的另外一个工具阻塞IO检测工具
我们会在后面给大家介绍。phper在进阶的时候总会遇到一些问题和瓶颈,业务代码写多了没有方向感,不知道该从那里入手去提升,对此我整理了一些资料,包括但不限于:分布式架构、高可扩展、高性能、高并发、服务器性能调优、TP6,laravel,YII2,Redis,Swoole、Kafka、Mysql优化、shell脚本、Docker、微服务、Nginx等多个知识点高级进阶干货需要的可以免费分享给大家,需要的(点击→)我的官方群677079770
PHP 教你使用 Swoole-Tracker 秒级定位 PHP 卡死问题的更多相关文章
- 教你使用 Swoole-Tracker 秒级定位 PHP 卡死问题
PHPer 肯定收到过这样的投诉:小菊花一直在转!你们网站怎么这么卡!当我们线上业务遇到这种卡住(阻塞)的情况,大部分 PHPer 会两眼一抹黑,随后想起那句名言:性能瓶颈都在数据库然后把锅甩给DBA ...
- php Swoole实现毫秒级定时任务
项目开发中,如果有定时任务的业务要求,我们会使用linux的crontab来解决,但是它的最小粒度是分钟级别,如果要求粒度是秒级别的,甚至毫秒级别的,crontab就无法满足,值得庆幸的是swoole ...
- Swoft 2.0.5 更新,新增高效秒级定时任务、异常管理组件
什么是 Swoft ? Swoft 是一款基于 Swoole 扩展实现的 PHP 微服务协程框架.Swoft 能像 Go 一样,内置协程网络服务器及常用的协程客户端且常驻内存,不依赖传统的 PHP-F ...
- Swoole实现毫秒级定时任务
项目开发中,如果有定时任务的业务要求,我们会使用linux的crontab来解决,但是它的最小粒度是分钟级别,如果要求粒度是秒级别的,甚至毫秒级别的,crontab就无法满足,值得庆幸的是swoole ...
- Linux下实现秒级的crontab定时任务
crontab的格式如下 * * * * * command 分 时 日 月 周 命令 第1列表示分钟1-59 每分钟用*或者 */1表示 第2列表示小时1-23(0表示0点) 第3列表示日期1-31 ...
- Android 秒级编译 Freeline
http://mp.weixin.qq.com/s?__biz=MzA4NTQwNDcyMA==&mid=2650662410&idx=1&sn=c654fa7b0cc8c91 ...
- redis+Keepalived主从热备秒级切换
一 简介 安装使用centos 5.10 Master 192.168.235.135 Slave 192.168.235.152 Vip 192.168.235.200 编译环境 yum -y in ...
- 第四章 电商云化,4.1 17.5W秒级交易峰值下的混合云弹性架构之路(作者:唐三 乐竹 锐晟 潇谦)
4.1 17.5W秒级交易峰值下的混合云弹性架构之路 前言 每年的双11都是一个全球狂欢的节日,随着每年交易逐年创造奇迹的背后,按照传统的方式,我们的成本也在逐年上升.双11当天的秒级交易峰值平时的近 ...
- 百亿级别数据量,又需要秒级响应的案例,需要什么系统支持呢?下面介绍下大数据实时分析工具Yonghong Z-Suite
Yonghong Z-Suite 除了提供优秀的前端BI工具之外,Yonghong Z-Suite让用户可以选购分布式数据集市来支持实时大数据分析. 对于这种百亿级的大数据案例,Yonghong Z- ...
随机推荐
- eclipse中的项目运行时不出现run as→java application选项
eclipse中的运行java project时不出现run as→java application选项? 解决方案☞必须有正确的主方法,即public static void main(String ...
- 介绍ArcGIS中各种数据的打开方法——mxd(地图文档)
1.加载地图文档 在ArcGIS中,以mxd作为扩展名的文件叫地图文档. 地图文档中只是包含图层的引用,即存储当前地图的图层路径.符号.状态.修饰等信息,并不存储真实的数据层. ArcGIS Map中 ...
- Python_箱型图绘制与特征值获取
它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较 如何利用Python绘制箱型图 需要的import的包 import matplotlib.pyplot as plt from m ...
- win10下git与gitlab安装与文件上传
目前了解到的版本管理工具有三种:gitlab GitHub 和 码云 个人感觉 gitlab 在公司用的较多 便于协同办公 GitHub各种资源有很多,适合个人使用 码云是中文版 便于入门 ...
- 零基础:如何快速学习JavaScript,html+css技术
前端开发要学的知识内容涉及的会很宽泛,虽然说主要是HTML.CSS和JavaScript这些基础知识点,但达妹今天想强调一下,学前端开发除了要学这些基础知识外,学员还要在这之上进行延伸和深入的去学,而 ...
- 存储过程导出数据到csv
USE [database] GO SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO -- P_AutoInspect_LogToFilePath 'F ...
- VS2017-Linux项目-使用第三方库如何配置
1.虚拟机Ubuntu 16.04,安装第三方库,perftools::tcmalloc. 2.Win10下vs2017创建linux项目. 3.项目>>属性>>VC++ 目录 ...
- Java中的锁[原理、锁优化、CAS、AQS]
1.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 2.锁实现的基本原理 2.1.volatile Java编程语言允许线程访问共享变量, 为了确保共享变量能被准确和一致地更新, ...
- 设计模式C++描述----12.享元(Flyweight)模式
一. 概述 在面向对象系统的设计何实现中,创建对象是最为常见的操作. 这里面就有一个问题:如果一个应用程序使用了太多的对象,就会造成很大的存储开销.特别是对于大量轻量级(细粒度)的对象,比如在文档编辑 ...
- 讲一讲快速学习WPF的思路
我不想浪费大家的时间,直接奔主题了. 首先大家要明白,WPF跟Winform的区别,优点,缺点. 首先入门来讲 Winform简单点,WPF会难一点.所以第一次接触C# 我推荐用Winform项目去学 ...