php的抓取

<?php
/**
 * Created by PhpStorm.
 * User: s
 * Date: 2018/11/6
 * Time: 18:14
 */

include "vendor/autoload.php";
//引入类
use QL\QueryList;

class QueClassTwo
{
   protected $_pdo;
   public function __construct()
   {
       $this->_pdo = new  PDO("mysql:host=127.0.0.1;dbname=student","root","root");
   }
   public function getDate($url)
   {
       //设置采集规则
       $rules=[
           'title'=>['h3','text'],
           'url'=>['.juti_new>.juti_list>h3>a','href'],
           'img'=>['.ju_pic>a>img','src'],
           'content'=>['.juti_new>.juti_list>h3>a','href'],
           'addtime'=>['.ping03','text']
       ];
       $data = QueryList::Query($url,$rules)->data;
       $this->addData($data);
       return true;
   }
   //数据入库
    public function addData($data)
    {
        if(empty($data)) return false;
        $sql="insert into seven_17(title,url,img,content,addtime) VALUES ";
        foreach ($data as $k=>$v)
        {
            if(!empty($v['img']))
            {
                //名称按/分割后数组
                $imgname=explode('/',$v['img']);
                //根据数量最后一位获取图片名称
                $num=count($imgname);
                $name=$imgname[$num-1];
                //写入
                $imgdata=file_get_contents($v['img']);
                file_put_contents('./img/'.$name,$imgdata);
                $sql .="('{$v['title']}','{$v['url']}','{$v['img']}','{$v['content']}','{$v['addtime']}'),";
            }
        }
        $sql = substr($sql,0,-1);//除去sql语句后面的,号
        $this->_pdo->exec($sql);
        return true;
    }
}

php的抓取的更多相关文章

用WebRequest +HtmlAgilityPack 从外网抓取数据到本地
相信大家对于WebRequest 并不陌生,我们在C#中发请求的方式,就是创建一个WebRequest .那么如果我们想发一个请求到外网,比如国内上不了的一些网站,那么该怎么做呢? 其实WebRequ ...
Phantomjs+Nodejs+Mysql数据抓取（2.抓取图片）
概要这篇博客是在上一篇博客Phantomjs+Nodejs+Mysql数据抓取(1.抓取数据) http://blog.csdn.net/jokerkon/article/details/50868 ...
[转]Fiddler抓取Android真机上的HTTPS包
此篇文章转载自:http://blog.csdn.net/roland_sun/article/details/30078353 工作中经常会需要对一些app进行抓包, 但是每次默认都是只抓http请 ...
爬虫技术 -- 进阶学习（十）网易新闻页面信息抓取（htmlagilitypack搭配scrapysharp）
最近在弄网页爬虫这方面的,上网看到关于htmlagilitypack搭配scrapysharp的文章,于是决定试一试~ 于是到https://www.nuget.org/packages/Scrapy ...
Phantomjs+Nodejs+Mysql数据抓取（1.数据抓取）
概要: 这篇博文主要讲一下如何使用Phantomjs进行数据抓取,这里面抓的网站是太平洋电脑网估价的内容.主要是对电脑笔记本以及他们的属性进行抓取,然后在使用nodejs进行下载图片和插入数据库操作. ...
网络爬虫：使用Scrapy框架编写一个抓取书籍信息的爬虫服务
上周学习了BeautifulSoup的基础知识并用它完成了一个网络爬虫( 使用Beautiful Soup编写一个爬虫系列随笔汇总 ), BeautifulSoup是一个非常流行的Python网 ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格
通过上一篇随笔的处理,我们已经拿到了书的书名和ISBN码.(网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息 ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码
这一篇首先从allitebooks.com里抓取书籍列表的书籍信息和每本书对应的ISBN码. 一.分析需求和网站结构 allitebooks.com这个网站的结构很简单,分页+书籍列表+书籍详情页. ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(1): 基础知识Beautiful Soup
开始学习网络数据挖掘方面的知识,首先从Beautiful Soup入手(Beautiful Soup是一个Python库,功能是从HTML和XML中解析数据),打算以三篇博文纪录学习Beautiful ...
python爬虫成长之路（一）：抓取证券之星的股票数据
获取数据是数据分析中必不可少的一部分,而网络爬虫是是获取数据的一个重要渠道之一.鉴于此,我拾起了Python这把利器,开启了网络爬虫之路. 本篇使用的版本为python3.5,意在抓取证券之星上当天所 ...

随机推荐

P2517 [HAOI2010]订货
思路费用流水题对每月拆点,入点向出点连cap=ui的边,s向入点连cost=di的边,i的入点向i+1的入点连cap=S的边即可代码 #include <cstdio> #inclu ...
BZOJ4455 小星星
闲扯看到多个限制条件的计数题目,就想到容斥原理思路题目要求两个条件 - 编号一一对应 - 树上存在的边,在图上映射到的点上也应该存在考虑一个暴力的dp,设\(dp_{i,j}\)表示i点编号对 ...
Python 安装与环境变量配置
一.软件下载 Python安装包下载地址:https://www.python.org/ 二.安装过程(略) 三.环境变量配置: 方法一:使用cmd命令添加path环境变量在cmd下输入: path ...
解决pip ReadTimeoutError问题
参考: 更新pip时报错:Read Timeout Error 解决pip ReadTimeoutError问题问题:在Mac OSX系统下使用pip install时报错: ReadTimeout ...
Javascript 日期格式化相关操作
1.相关扩展函数 //--------------------------------------------------- // 判断闰年 //--------------------------- ...
P2512 [HAOI2008]糖果传递
题目描述有n个小朋友坐成一圈,每人有ai个糖果.每人只能给左右两人传递糖果.每人每次传递一个糖果代价为1. 输入输出格式输入格式: 小朋友个数n 下面n行 ai 输出格式: 求使所有人获得均等糖果 ...
linux系统下各类软件安装笔记
安装环境: linux版本:ubuntu 16.04 安装python3.6 sudo add-apt-repository ppa:jonathonf/python-3.6 ...
SQL Server DATEADD() 函数及实际项目应用注意事项
1. DATEADD() 函数的解释和语法分析 DATEADD() 函数在日期中添加或减去指定的时间间隔. 语法: DATEADD(datepart,number,date) date 参数是合法的日 ...
R语言矩阵栅格显示矩阵颜色显示
效果如下:
pipenv安装.whl
windows下很多库安装不方便,主要是编译C之类的. 之前这样做: 1去https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载各种版本编译好的.whl 2 pi ...

php的抓取

php的抓取的更多相关文章

随机推荐

热门专题