1. function curl_multi($urls) {
  2. if (!is_array($urls) or count($urls) == 0) {
  3. return false;
  4. }
  5. $num=count($urls);
  6. $curl = $curl2 = $text = array();
  7. $handle = curl_multi_init();
  8. function createCh($url) {
  9. $ch = curl_init();
  10. curl_setopt ($ch, CURLOPT_URL, $url);
  11. curl_setopt ($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; Trident/7.0; rv:11.0) like Gecko');//设置头部
  12. curl_setopt ($ch, CURLOPT_REFERER, $url); //设置来源
  13. curl_setopt ($ch, CURLOPT_ENCODING, "gzip"); // 编码压缩
  14. curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
  15. curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);//是否采集301、302之后的页面
  16. curl_setopt ($ch, CURLOPT_MAXREDIRS, 5);//查找次数,防止查找太深
  17. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // 对认证证书来源的检查
  18. curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); // 从证书中检查SSL加密算法是否存在
  19. curl_setopt ($ch, CURLOPT_TIMEOUT, 20);
  20. curl_setopt ($ch, CURLOPT_HEADER, 0);//输出头部
  21. return $ch;
  22. }
  23. foreach($urls as $k=>$v){
  24. $url=$urls[$k];
  25. $curl[$k] = createCh($url);
  26. curl_multi_add_handle ($handle,$curl[$k]);
  27. }
  28. $active = null;
  29. do {
  30. $mrc = curl_multi_exec($handle, $active);
  31. } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  32. while ($active && $mrc == CURLM_OK) {
  33. if (curl_multi_select($handle) != -1) {
  34. usleep(100);
  35. }
  36. do {
  37. $mrc = curl_multi_exec($handle, $active);
  38. } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  39. }
  40. foreach ($curl as $k => $v) {
  41. if (curl_error($curl[$k]) == "") {
  42. $text[$k] = (string) curl_multi_getcontent($curl[$k]);
  43. }
  44. curl_multi_remove_handle($handle, $curl[$k]);
  45. curl_close($curl[$k]);
  46. }
  47. curl_multi_close($handle);
  48. return $text;
  49. }
  50. $urls=array('http://www.baidu.com',
  51. 'http://www.baidu.com',
  52. 'http://www.baidu.com',
  53. 'http://www.baidu.com',
  54. 'http://www.baidu.com',
  55. 'http://www.baidu.com',
  56. 'http://www.baidu.com',
  57. 'http://www.baidu.com'
  58. );
  59. $res=curl_multi($urls);
  60. print_r($res);

PHP 多线程采集的更多相关文章

  1. Python多线程采集百度相关搜索关键词

    百度相关搜索关键词抓取,读取txt关键词,导出txt关键词 #百度相关搜索关键词抓取,读取txt关键词,导出txt关键词   # -*- coding=utf-8 -*- import request ...

  2. python3 多线程 采集 xpath

    #!/usr/bin/python # -*- coding: UTF-8 -*- '''Thread3 多线程测试采集''' import threading,time,queue,Mongo_ut ...

  3. python多线程采集

    import requests import json import threading Default_Header = { #具体请求头自己去弄 } _session=requests.sessi ...

  4. PHP使用CURL_MULTI实现多线程采集

    $connomains = array( "http://www.baidu.com/", "http://www.hao123.com/", "ht ...

  5. python多线程采集图片

    cmd中运行 >python untitled2.py    图片的网站 import requests import threading from bs4 import BeautifulSo ...

  6. PHP cURL应用实现模拟登录与采集使用方法详解

    对于做过数据采集的人来说,cURL一定不会陌生.虽然在PHP中有file_get_contents函数可以获取远程链接的数据,但是它的可控制性太差了,对于各种复杂情况的采集情景,file_get_co ...

  7. 多线程实际运用<第七篇>

    1.单线程采集100个页面 class Program { static int i = 6991275; static void Main(string[] args) { Stopwatch sw ...

  8. PHP cURL实现模拟登录与采集使用方法详解教程

    来源:http://www.zjmainstay.cn/php-curl 本文将通过案例,整合浏览器工具与PHP程序,教你如何让数据 唾手可得 . 对于做过数据采集的人来说,cURL一定不会陌生.虽然 ...

  9. 转载 多线程实际运用<第七篇>

    多线程实际运用<第七篇> 1.单线程采集100个页面 class Program { static int i = 6991275; static void Main(string[] a ...

随机推荐

  1. AsciiPic Java视频转成字符画

    AsciiPic Java视频转成字符画 github下载 https://github.com/dejavudwh/AsciiPic 运行截图 //没有做GUI 比较简陋 节省时间 main里的文件 ...

  2. 支持向量机SVM 初识

    虽然已经学习了神经网络和深度学习并在几个项目之中加以运用了,但在斯坦福公开课上听吴恩达老师说他(在当时)更喜欢使用SVM,而很少使用神经网络来解决问题,因此来学习一下SVM的种种. 先解释一些概念吧: ...

  3. IBM基于Kubernetes的容器云全解析

    基于Kubernetes的容器云 容器云最主要的功能是以应用为中心,帮助用户把所有的应用以容器的形式在分布式里面跑起来,最后把应用以服务的形式呈现给用户.容器云里有两个关键点,一是容器编排,二是资源调 ...

  4. Dubbo背景和简介

    转载出处 Dubbo开始于电商系统,因此在这里先从电商系统的演变讲起. 单一应用框架(ORM) 当网站流量很小时,只需一个应用,将所有功能如下单支付等都部署在一起,以减少部署节点和成本. 缺点:单一的 ...

  5. python3【基础】-字符串 常用的方法

    字符串一个最重要的特性就是不可修改. name.capitalize() 首字母大写 name.casefold() 大写全部变小写 name.center(50,"-") 输出 ...

  6. java不用任何已有方法完全自写的去重法

    package aa; class InsertSort{ private long[] a; private int nElems; //构造方法 public InsertSort(int max ...

  7. Scrum立会报告+燃尽图(Beta阶段第七次)

    此作业要求参见:https://edu.cnblogs.com/campus/nenu/2018fall/homework/2388 项目地址:https://coding.net/u/wuyy694 ...

  8. Unicode 和 UTF-8 有何区别

    作者:于洋链接:https://www.zhihu.com/question/23374078/answer/69732605来源:知乎著作权归作者所有,转载请联系作者获得授权. ========== ...

  9. 第5章 首次登录与在线求助man page

    首次登录系统 centos默认图像界面为GNOME. Linux默认情况下会提供6个Terminal来让用户登录,切换方式为ctrl+alt+[F1-F6],系统将这六个操作界面命名为tty1-tty ...

  10. 判断字符串中是否存在的几种方案:string.indexof、string.contains、list.contains、list.any几种方式效率对比

    我们在做项目时,可能会遇到这样的需求,比如判断,1,2,3,33,22,123, 中是否存在,3,. var str=",1,2,3,33,22,123,"; 一般有几种方式: 1 ...