curl_multi实现并发
普通请求
curl_normal.php
<?php
$srart_time = microtime(TRUE);
$chArr=[];
//创建多个cURL资源
for($i=0; $i<10; $i++){
$chArr[$i]=curl_init();
curl_setopt($chArr[$i], CURLOPT_URL, "http://www.52fhy.com/test.json");
curl_setopt($chArr[$i], CURLOPT_RETURNTRANSFER, 1);
curl_setopt($chArr[$i], CURLOPT_TIMEOUT, 1);
$result[] = curl_exec($chArr[$i]);
echo "running ";
}
// print_r($result);
$end_time = microtime(TRUE);
echo sprintf("use time:%.3f s", $end_time - $srart_time);
?>
use time:0.830 s
curl_multi并发
curl_multi.php
<?php
$srart_time = microtime(TRUE);
$chArr=[];
//创建多个cURL资源
for($i=0; $i<10; $i++){
$chArr[$i]=curl_init();
curl_setopt($chArr[$i], CURLOPT_URL, "http://www.52fhy.com/test.json");
curl_setopt($chArr[$i], CURLOPT_RETURNTRANSFER, 1);
curl_setopt($chArr[$i], CURLOPT_TIMEOUT, 1);
}
$mh = curl_multi_init(); //1 创建批处理cURL句柄
foreach($chArr as $k => $ch){
curl_multi_add_handle($mh, $ch); //2 增加句柄
}
$active = null;
//待优化点:
//在$active > 0,执行curl_multi_exec($mh,$active)而整个批处理句柄没有全部执行完毕时,系统会不停地执行curl_multi_exec()函数。
do{
echo "running ";
curl_multi_exec($mh, $active); //3 执行批处理句柄
}while($active > 0); //4
foreach($chArr as $k => $ch){
$result[$k]= curl_multi_getcontent($ch); //5 获取句柄的返回值
curl_multi_remove_handle($mh, $ch);//6 将$mh中的句柄移除
}
curl_multi_close($mh); //7 关闭全部句柄
// print_r($result);
$end_time = microtime(TRUE);
echo sprintf("use time:%.3f s", $end_time - $srart_time);
?>
use time:0.259 s
curl_multi并发优化:curl_multi_select
在上个示例里当$active > 0时,执行curl_multi_exec($mh,$active)而整个批处理句柄没有全部执行完毕时,系统会不停地执行curl_multi_exec()函数。这样可能会轻易导致CPU占用很高。
进行改动的方式是应用curl函数库中的curl_multi_select()函数,其函数原型如下:
int curl_multi_select ( resource $mh [, float $timeout = 1.0 ] )
阻塞直到cURL批处理连接中有活动连接。成功时返回描述符集合中描述符的数量。失败时,select失败时返回-1,否则返回超时(从底层的select系统调用)。
我用们curl_multi_select()函数来达到没有需要读取的程序就阻塞住的目的。
下面是优化部分的代码:
curl_multi_select.php
$active = null;
do{
echo "running ";
$mrc = curl_multi_exec($mh, $active); //3 执行批处理句柄
}while ($mrc == CURLM_CALL_MULTI_PERFORM); //4
//本次循环第一次处理$mh批处理中的$ch句柄,并将$mh批处理的执行状态写入$active ,当状态值等于CURLM_CALL_MULTI_PERFORM时,表明数据还在写入或读取中,执行循环,当第一次$ch句柄的数据写入或读取成功后,状态值变为CURLM_OK,跳出本次循环,进入下面的大循环之中。
//$active 为true,即$mh批处理之中还有$ch句柄正待处理,$mrc==CURLM_OK,即上一次$ch句柄的读取或写入已经执行完毕。
while ($active && $mrc == CURLM_OK) {
if (curl_multi_select($mh) != -1) {//$mh批处理中还有可执行的$ch句柄,curl_multi_select($mh) != -1程序退出阻塞状态。
do {
$mrc = curl_multi_exec($mh, $active);//继续执行需要处理的$ch句柄。
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
}
}
这样执行的好处是$mh批处理中的$ch句柄会在读取或写入数据结束后($mrc==CURLM_OK),进入curl_multi_select($mh)的阻塞阶段,而不会在整个$mh批处理执行时不停地执行curl_multi_exec,白白浪费CPU资源。
运行结果:
use time:0.325 s
耗时并没有多少改变,只是性能提高了。
curl_multi并发优化:rolling
上面的例子还存在优化的空间, 优化的方式时当某个URL请求完毕之后尽可能快的去处理它, 边处理边等待其他的URL返回, 而不是等待那个最慢的接口返回之后才开始处理等工作, 从而避免CPU的空闲和浪费。
仅贴出修改部分:
curl_multi_rolling.php
$active = null;
do {
while (($mrc = curl_multi_exec($mh, $active)) == CURLM_CALL_MULTI_PERFORM) ;
if ($mrc != CURLM_OK) { break; }
// a request was just completed -- find out which one
while ($done = curl_multi_info_read($mh)) {
// get the info and content returned on the request
$info = curl_getinfo($done['handle']);
$error = curl_error($done['handle']);
$result[] = curl_multi_getcontent($done['handle']);
// $responses[$map[(string) $done['handle']]] = compact('info', 'error', 'results');
// remove the curl handle that just completed
curl_multi_remove_handle($mh, $done['handle']);
curl_close($done['handle']);
}
// Block for data in / output; error handling is done by curl_multi_exec
if ($active > 0) {
curl_multi_select($mh);
}
} while ($active);
use time:0.267 s
参考
1、PHP模拟发送POST请求之五curl基本使用和多线程优化
http://www.cnblogs.com/zhenbianshu/p/4935679.html
2、Rolling cURL: PHP并发最佳实践
https://www.oschina.net/question/54100_58279
3、curl_multi_select解决curl_multi网页假死问题
http://www.webkaka.com/tutorial/php/2013/102844/
curl_multi实现并发的更多相关文章
- 使用PHP并发执行任务–curl_multi应用
使用PHP并发执行任务–curl_multi应用 原网址:http://lampblog.org/category/phpdev
- 使用multi curl进行http并发访问
curl是一款利用URL语法进行文件传输的工具,它支持多种协议,包括FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET等,我们既可以在命令行上使用它,也可以利用 libcur ...
- 利用curl并发来提高页面访问速度
在我们平时的程序中难免出现同时访问几个接口的情况,平时我们用curl进行访问的时候,一般都是单个.顺序访问,假如有3个接口,每个接口耗时500毫 秒那么我们三个接口就要花费1500毫秒了,这个问题太头 ...
- curl_multi_select解决curl_multi网页假死问题
curl_multi可以批处理事务,给网页编程带来很大的方便.不过在使用curl_multi的过程中,我们会遇到一个比较头疼的问题,那就是当并发处理的事务数量过多的时候,就会出现CPU过高,网页假死的 ...
- PHP也玩并发,巧用curl 并发减少后端访问时间
首先,先了解下 php中的curl多线程函数: # curl_multi_add_handle# curl_multi_close# curl_multi_exec# curl_multi_getco ...
- PHP实现并发请求
后端服务开发中经常会有并发请求的需求,比如你需要获取10家供应商的带宽数据(每个都提供不同的url),然后返回一个整合后的数据,你会怎么做呢? 在PHP中,最直观的做法foreach遍历urls,并保 ...
- 高并发HHTP实践
当今,正处于互联网高速发展的时代,每个人的生活都离不开互联网,互联网已经影响了每个人生活的方方面面.我们使用淘宝.京东进行购物,使用微信进行沟通,使用美图秀秀进行拍照美化等等.而这些每一步的操作下面, ...
- .Net多线程编程—并发集合
并发集合 1 为什么使用并发集合? 原因主要有以下几点: System.Collections和System.Collections.Generic名称空间中所提供的经典列表.集合和数组都不是线程安全 ...
- [ 高并发]Java高并发编程系列第二篇--线程同步
高并发,听起来高大上的一个词汇,在身处于互联网潮的社会大趋势下,高并发赋予了更多的传奇色彩.首先,我们可以看到很多招聘中,会提到有高并发项目者优先.高并发,意味着,你的前雇主,有很大的业务层面的需求, ...
随机推荐
- 消除ExtJS6的extjs-trila字样
- 第二章 Idea搭建maven
第二章 Idea搭建maven 1.配置Maven的环境变量 a.首先我们去maven官网下载Maven程序,解压到安装目录,如图所示: b.配置M2_HOME(MAVEN_HOME)的环境变量,然后 ...
- 新概念英语(1-127)A famous actoress(女演员)
A:Can you recognize that woman, Liz ?B:I think I can, Kate. It must be Karen Marsh, the actoress.A:I ...
- 记一次将公司网站http换成https
看了博客园将近一年了,一直都只是在被动的看,总觉得应该写点什么,但是又不知道该写点什么.今天正好公司要把网站由http换成https,那我就顺便记录一下吧. 由于之前没有弄过,所以就面向百度编程. 首 ...
- loadrunner录制时web时,安全证书问题
测试环境:win7+LoadRunner11+ie9 遇到的问题:用LoadRunner录制时,打开百度,总是报安全证书问题,如图所示 解决方法:Tools——Recording Options——p ...
- mangodb的基本操作:增删改差
MongoDB三元素: 1 数据库: 和关系型数据库中数据库的层次相同,内部可以有多个集合. 2 集合: 相当于关系型数据库中的表,存储若干文档,结构不固定 3 文档: 相当于关系型数据库中的行,是J ...
- 翻译:JVM虚拟机规范1.7中的运行时常量池部分(二)
本篇为JVM虚拟机规范1.7中的运行时常量池部分系列的第二篇. 4.4.4. The CONSTANT_Integer_info and CONSTANT_Float_info Structures ...
- python--IO模块
IO模块 一 IO模型 分为: 1 阻塞IO (accept recv) 2 非阻塞IO 3 IO多路复用(监听多个链接) 4 异步IO 5 驱动信号模型(不经常使用) 1 阻塞IO (blocki ...
- uva 10870
https://vjudge.net/problem/UVA-10870 题意: f(n) = a1f(n − 1) + a2f(n − 2) + a3f(n − 3) + . . . + adf(n ...
- ABP跨域调用API时出现的问题
public override void Initialize() { IocManager.RegisterAssemblyByConvention(Assembly.GetExecutingAss ...