<?php
header("Content-type:text/html; charset=utf-8");
/*
$pattern =
'/xxx(.*)yyyy/isU'; //i 不区分大小,s表示点号匹配换行 U 防贪婪匹配
$url = "";
$ch =
curl_init($url);
$options = array(
            CURLOPT_RETURNTRANSFER
=> true,         // return web page 以字符流返回不输出浏览器
         //
CURLOPT_HEADER         => false,        // don't return headers
        
// CURLOPT_FOLLOWLOCATION => true,         // follow redirects
         //
CURLOPT_ENCODING       => "",           // handle all encodings
          
 //CURLOPT_USERAGENT      => "spider",     // who am i
         //
CURLOPT_AUTOREFERER    => true,         // set referer on redirect
      
     CURLOPT_CONNECTTIMEOUT => 120,          // timeout on connect
      
     CURLOPT_TIMEOUT        => 120,          // timeout on response
      
  // CURLOPT_MAXREDIRS      => 10,           // stop after 10 redirects
  
      // CURLOPT_POST            => 1,            // i am sending post
data
            //   CURLOPT_POSTFIELDS     => $curl_data,    // this are
my post vars
        //  CURLOPT_SSL_VERIFYHOST => 0,            // don't
verify ssl
        //  CURLOPT_SSL_VERIFYPEER => false,        //
  
      // CURLOPT_VERBOSE        => 1                //
    );
      
 curl_setopt_array($ch, $options);
        $texts = curl_exec($ch);
      
 if(preg_match($pattern, $texts, $arr)){
        //$arr[0] 包含正则中的字符
      
 // $arr[1] 不包含正则中的字符
        }

if(preg_match_all($pattern,
$texts, $arr)){
            //返回一个二维数组,包含多次匹配数据

}
      
 curl_close($ch);

function
imgDownload($url, $filename){
            // $url 正确的文件名 如 $url =
'xxx/1.jpg'
            // $filename 正确的文件名 如 $filename = 'yyyyy/1.jpg'
  
         if(!$url || !$filename){
                return false;
          
 }
            $str = file_get_contents($url);
            $fp =
fopen($filename, 'a');
            fwrite($fp, $str);
          
 fclose($fp);
        }
        $url = 'img/2.jpg';
        $filename =
'ok/2.jpg';
        imgDownload($url, $filename)
*/
?>

PHP curl 采集内容之规则 及图片下载方法2的更多相关文章

  1. PHP curl 采集内容之规则 1

    <?phpheader("Content-type:text/html; charset=utf-8");$pattern = '/xxx(.*)yyyy/isU'; //i ...

  2. CSharpGL(19)用glReadPixels把渲染的内容保存为PNG图片(C#)

    CSharpGL(19)用glReadPixels把渲染的内容保存为PNG图片(C#) 效果图 本文解决了将OpenGL渲染出来的内容保存到PNG图片的方法. 下载 CSharpGL已在GitHub开 ...

  3. php ecshop采集商品添加规则

    ecshop采集商品添加规则 <?phpheader("Content-type:text/html;charset=utf-8"); function get($url) ...

  4. php curl 采集

    curl 采集五个步骤: 1.curl_init()初始化curl 2.curl_setopt()设置传输数据和参数 3.curl_exec()执行传输并获取返回数据 4.curl_errono()返 ...

  5. 如何给wordpress首页自动显示文章内容的第一个图片

    敏捷个人手机应用中使用到的数据来源于wordpress中,因为自己写的页面,所以可以自己写代码获取文章内容的第一个图片作为文章缩略图来显示,这样用户看到首页时图文并茂,感觉会好一些. 现在后台简单的使 ...

  6. PHP用正则批量替换Img中src内容,用正则表达式获取图片路径实现缩略图功能

    PHP用正则批量替换Img中src内容,用正则表达式获取图片路径实现缩略图功能 网上很多正则表达式只能获取或者替换一个img的src内容,或者只能替换固定的字符串,要动态替换多个图片内容的试了几个小时 ...

  7. Curl 采集乱码 gzip 原因及解决方案 utf-8

    用curl获取一个经过gzip压缩后的网页时返回乱码 原因大体就是服务器返回的Content-Encoding的值和网页的编码不同,造成curl解码出问题,直接将gzip或deflate编码的文件下载 ...

  8. ueditor编辑文章时候,复制粘贴内容,原来的图片不能显示

    ueditor编辑文章时候.当现有文章有图片的时候, 再复制粘贴文本进去的时候.里面的图片就不能显示了, 编辑器查看文章Html代码,图片路径显示为:src="http://localhos ...

  9. 第三百四十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—meta属性返回指定值给回调函数—Scrapy内置图片下载器

    第三百四十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—meta属性返回指定值给回调函数—Scrapy内置图片下载器 编写spiders爬虫文件循环 ...

随机推荐

  1. IOS学习笔记38--@class #import辨析 #include

    tyle="margin:20px 0px 0px; line-height:26px; font-family:Arial"> #include         区分 #i ...

  2. 抽象类Abstract的简单使用

    写了一个比较简单易懂的例子,如下图 AbstractBaseClass是抽象的基类,Class1,Class2是继承他的子类,并实现他的方法. //AbstractBaseClass.cs里的代码 p ...

  3. Apache CXF框架结构和基本原理(转)

    原文链接:http://blog.sina.com.cn/s/blog_6182547f01017pak.html CXF旨在为服务创建必要的基础设施,它的整体架构主要由以下几个部分组成: 1.Bus ...

  4. creating normals from alpha/heightmap inside a shader

    http://www.polycount.com/forum/showthread.php?t=117185 I am making some custom terrain shaders with ...

  5. android100 自定义内容提供者

    #ContentProvider,就是来操作数据的,增删改查, * 四大组件之一 * 应用的数据库是不允许其他应用访问的 * 内容提供者的作用就是让别的应用访问到你的数据库 * 内容提供者的作用:把私 ...

  6. careercup-数学与概率 7.7

    7.7 有些数的素因子只有3.5.7,请设计一个算法,找出其中第k个数. 解法: 首先,我们可以将满足条件的前几个数列出来,以此寻找解题思路. 一种简单的思路就是对于已经列出的数,我们依次去乘以3,5 ...

  7. select组件2

    <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/ ...

  8. Android(java)学习笔记209:采用get请求提交数据到服务器(qq登录案例)

    1.GET请求:    组拼url的路径,把提交的数据拼装url的后面,提交给服务器. 缺点:(1)安全性(Android下提交数据组拼隐藏在代码中,不存在安全问题)  (2)长度有限不能超过4K(h ...

  9. linux下grep命令笔记

    grep    -i 不区分大小写    --color 添加颜色        alias grep=‘grep --color=auto’    -v 显示没有被模式匹配到的行    -o 只显示 ...

  10. js广告浮动

    一个广告框在指定区域,有定位属性的父级区域内,一直向右向左移动,如果碰到左右边框,反向,如果碰到上下边距,反向,实现在指定框中浮动的效果. <!doctype html> <html ...