php 读取网站页面源码的经典函数

Snoopy.class.php下载

include "inc/Snoopy.class.php";

        //读取网页,返回网页源文件内容

function read_url($str){

                   $snoopy = new Snoopy;

                    $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)";

                   //$snoopy->agent="Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36";

                   $snoopy->rawheaders["Pragma"] = "no-cache";

                   $snoopy->maxredirs = 2;

                   $snoopy->offsiteok = false;

                   $snoopy->expandlinks = false;

                if($snoopy->fetch($str))

                   {

                       $result=htmlspecialchars($snoopy->results);

                   } 

             if ($result=="")

             {

                  if(function_exists("curl_init"))

                      {

                         if(!function_exists("lex_curl"))

                             {

                               function lex_curl($url)

                                 {

                                     $ch = curl_init();

                                     curl_setopt ($ch, CURLOPT_URL, $url);

                                     curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);

                                     curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, 30);

                                     curl_setopt ($ch, CURLOPT_TIMEOUT, 30);

                                     curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, TRUE);

                                     curl_setopt ($ch, CURLOPT_MAXREDIRS, 2);

                                     $file_contents = curl_exec($ch);

                                     curl_close($ch);

                                      if($file_contents=="1") $file_contents="";

                                      return $file_contents;

                                  }

                              }

                           $lex_function_get="lex_curl";

                       }

                   else

                      {$lex_function_get="file_get_contents";}

              $result=@$lex_function_get($str) or die($str.'->远程网址读取失败!');

             }

    return $result;

}

php 读取网站页面源码的经典函数的更多相关文章

在线制作微信跳转浏览器下载app/打开指定页面源码
微信自动跳转外部浏览器下载app/打开指定页面源码源码说明: 适用安卓和苹果系统,支持任何网页链接.并且无论链接是否已经被微信拦截,均可实现微信内自动跳转浏览器打开. 生成的跳转链接具有极佳的防拦截 ...
selenium3+python3.6爬页面源码的代码
from selenium import webdriver import unittest,time class my_test(unittest.TestCase): def setUp(self ...
2.18 爬页面源码（page_source）
2.18 爬页面源码(page_source) 前言有时候通过元素的属性的查找页面上的某个元素,可能不太好找,这时候可以从源码中爬出想要的信息.selenium的page_source方法可以获取到页 ...
Selenium2+python自动化37-爬页面源码（page_source）
前言有时候通过元素的属性的查找页面上的某个元素,可能不太好找,这时候可以从源码中爬出想要的信息.selenium的page_source方法可以获取到页面源码. selenium的page_sour ...
Selenium2+python自动化37-爬页面源码（page_source）【转载】
前言有时候通过元素的属性的查找页面上的某个元素,可能不太好找,这时候可以从源码中爬出想要的信息.selenium的page_source方法可以获取到页面源码. selenium的page_sour ...
Python3+Selenium3+webdriver学习笔记10（元素属性、页面源码）
#!/usr/bin/env python# -*- coding:utf-8 -*-'''Selenium3+webdriver学习笔记10(元素属性.页面源码)'''from selenium i ...
selenium3 + python - page_source页面源码
前言: 有时候通过元素的属性的查找页面上的某个元素,可能不太好找,这时候可以从源码中爬出想要的信息.selenium的page_source方法可以获取到页面源码. 本次以博客园为例,先爬取页面源码, ...
UI自动化之特殊处理四（获取元素属性\爬取页面源码\常用断言）
获取元素属性\爬取页面源码\常用断言,最终目的都是为了验证我们实际结果是否等于预期结果目录 1.获取元素属性 2.爬取页面源码 3.常用断言 1.获取元素属性获取title:driver.titl ...
简洁404页面源码 | 自适应404页面HTML好看的404源码下载
description:源码源码下载源码网源码自适应源码图片页面源码页面源码下载错误页源码 php源码 html源码动漫源码演示图如下: HTML代码片段: 1 <!DOCT ...

随机推荐

《算法》第五章部分程序 part 6
▶ 书中第五章部分程序,包括在加上自己补充的代码,非确定性有穷自动机(NFA),grep 命令(利用 NFA 匹配) ● 非确定性有穷自动机(NFA) package package01; impor ...
C#内存管理和垃圾回收机制
数据类型垃圾回收机制一.数据类型 C#中的数据类型分为值类型 (Value type) 和引用类型(reference type), 值类型: 所有的值类型都集成自 System.Value ...
cmd批处理命令及powershell
https://blog.csdn.net/wenzhongxiang/article/details/79256937 Powershell查询IP地址及主机名信息:1.foreach($ipv4 ...
asp.net Log4Net错误日志个人总结
1)创建Global.asax protected void Application_Start(object sender, EventArgs e) { log4net.Config.XmlCon ...
Spring MVC 的springMVC.xml疑问解析
<mvc:annotation-driven /> <mvc:annotation-driven /> 会自动注册DefaultAnnotationHandlerMapping ...
react-native android 权限问题
初入reactNative 的一个坑我是用的真机测试,没用安卓模拟器第一次在安卓上打开应用,提示权限问题: Overlay permissions needs to be granted in o ...
【Linux】CentOS7 安装，遇到的各种问题，并修复win7启动项
https://www.cnblogs.com/sxdcgaq8080/p/7457255.html ------------------------------------------------- ...
关于php MD5加密与java MD5 加密结果不一致的问题
针对PHP不是UTF-8编码导致的问题 public String md5(String txt) { try{ MessageDiges ...
Spring boot 日志
修改spring boot 默认日志的配置 #logging.path= # 不指定路径在当前项目下生成springboot.log日志 # 可以指定完整的路径: #logging.file=G:/s ...
jquery 属性-记住
$("").attr(); $("").removeAttr(); $("").prop(); $("").remove ...

php 读取网站页面源码的经典函数

php 读取网站页面源码的经典函数的更多相关文章

随机推荐

热门专题