Class MyCurl{
  protected $_pdo;
     //构造方法 链接数据库
  public function __construct(){
      $this->_pdo=new PDO("mysql:host=localhost;dbname=baseinfo","root","root");
  }
//CURL抓取

public function get($curl){
    $ch=curl_init($curl);
    curl_setopt($ch,CURLOPT_URL,$curl);
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($ch,CURLOPT_HEADER,0);
    curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false);
    curl_setopt($ch,CURLOPT_SSL_VERIFYHOST,10);
    $data=curl_exec($ch);
    curl_close($ch);
    return $data;
}

public function show($curl){
     $a=$this->get($curl);
     $b='#(正则表达式)#';

preg_match_all($b,$a,$arr);

(获取新闻信息获取数据,foreach循环处理)

foreach($arr[0] as $k =>$v){
  $arr1[]=[
      'url'=>$arr[1][$k],
      'name'=>$arr[2][$k],
      'money'=>$arr[3][$k],
      'address'=>$arr[4][$k],
      'company'=>$arr[5][$k],
     'time'=>$arr[6][$k]
  ];
}
  $this->add($arr1);
}

//添加数据
public function add($arr1){
    foreach($arr1 as $kk =>$vv){
            $url=$vv['url'];
            $name=$vv['name'];
            $company=$vv['company'];
            $money=$vv['money'];
            $time=$vv['time'];
            $address=$vv['address'];
            $sql="insert into yuekao values(null,'$name','$company','$money','$time','$address','$url')";
            $aa=$this->_pdo->query($sql);
            if($aa==1){
                 header("location:show.php");//跳转展示页面
            }
        }
     }
  }
}

//展示数据
<?php
$pdo=new PDO("mysql:host=localhost;dbname=baseinfo","root","root");//PDO连接数据库
$sql="select * from yuekao";
$list=$pdo->query($sql)->fetchAll();
include "show.html";

show.html展示数据

调用 CURL 使用正则抓取信息的更多相关文章

  1. php多线程抓取信息测试例子

    php多线程抓取信息测试例子 PHP 5.3 以上版本,使用pthreads PHP扩展,可以使PHP真正地支持多线程.多线程在处理重复性的循环任务,能够大大缩短程序执行时间. PHP扩展下载:htt ...

  2. java练习题(字符串类):显示4位验证码、输出年月日、从XML中抓取信息

    1.显示4位验证码 注:大小写字母.数字混合 public static void main(String[] args) { String s="abcdefghijklmnopqrstu ...

  3. java中使用 正则 抓取邮箱

    我们来抓取豆瓣网的邮箱吧!把这个页面的所有邮箱都抓取下来 如https://www.douban.com/group/topic/8845032/: 代码如下: package cn.zhangzon ...

  4. Python爬虫【三】利用requests和正则抓取猫眼电影网上排名前100的电影

    #利用requests和正则抓取猫眼电影网上排名前100的电影 import requests from requests.exceptions import RequestException imp ...

  5. 使用Request+正则抓取猫眼电影(常见问题)

    目前使用Request+正则表达式,爬取猫眼电影top100的例子很多,就不再具体阐述过程! 完整代码github:https://github.com/connordb/Top-100 总结一下,容 ...

  6. PHP利用Curl实现多线程抓取网页和下载文件

    PHP 利用 Curl  可以完成各种传送文件操作,比如模拟浏览器发送GET,POST请求等等,然而因为php语言本身不支持多线程,所以开发爬虫程序效率并不高,一般采集 数据可以利用 PHPquery ...

  7. PHP的cURL库:抓取网页,POST数据及其他,HTTP认证 抓取数据

    From : http://developer.51cto.com/art/200904/121739.htm 下面是一个小例程: ﹤?php// 初始化一个 cURL 对象$curl = curl_ ...

  8. 正则抓取网页所有href和src

    根据抓取的页面,用正则来匹配页面href和src string UserAgent = "Mozilla/5.0 (Windows NT 5.2; rv:29.0) Gecko/201001 ...

  9. WEB中调用Nutch执行JOB抓取

    参考:在Eclipse中运行Nutch 把nutch的源代码导入到eclipse工程自定义抓取任务. 下载源码: http://svn.apache.org/repos/asf/nutch/ 从svn ...

随机推荐

  1. GO语言的包

    包介绍 包(package)是多个Go源码的集合,go语言有很多内置包,比如fmt,os,io等. 定义包 main包是一个可执行的包,只应用程序的入口包,编译完会生成一个可执行文件. 包名可以不和文 ...

  2. 五一培训 DAY1

    DAY1 枚举 例题1 题解: 例题2 题解: 例题3 题解: vis[ ]判断是否为素数,pri[ ]储存素数 例题4 题解: 例题5 题解: PS: i  <  1<<n    ...

  3. mysql的group_concat列转行函数

    SELECT auditor,sum(count) total, GROUP_CONCAT(type,'=', count) AS type_count FROM auditor_dm_ol GROU ...

  4. 利用h5 meta 头标签设置og属性进行帖子分享图片时而有时而无

    <meta property="og:title" content="fgsfg"> <meta property="og:desc ...

  5. java0426 wen IO2

  6. minSdkVersion

    10   It is indeed possible to increase minSdkVersion, but it took me way too much time to find it ou ...

  7. Linux服务器 XAMPP后添加PHP和MYSQL环境变量

    编辑/etc/profile文件 在文件末尾添加两行代码 vi /etc/profile CentOS: PATH=$PATH:/opt/lampp/bin export PATH Ubuntu: e ...

  8. ERROR internal error: process exited while connecting to monitor

    centos7.4 创建kvm虚拟机时报错 问题: [root@oldboy ~]# virt-install --virt-type kvm --os-type=linux --os-variant ...

  9. mysql 删除重复数据

    1在日常使用mysql中 前端页面点击次数过多 mysql就会容易产生冗余数据,那这些数据该怎么删除呢 说下思路 查询重复字段id 查询重复字段最小id 删除重复字段ID 保留最小ID 查询重复记录这 ...

  10. 查看selenium API

    pydoc是Python自带的模块,主要用于从python模块中自动生成文档,这些文档可以基于文本呈现的.也可以生成WEB 页面的,还可以在服务器上以浏览器的方式呈现! 一.pydoc 1.到底什么是 ...