PHP curl模拟浏览器采集阿里巴巴的实现代码
<?php 
set_time_limit(0); 
function _rand() { 
$length=26; 
$chars = "0123456789abcdefghijklmnopqrstuvwxyz"; 
$max = strlen($chars) - 1; 
mt_srand((double)microtime() * 1000000); 
$string = ''; 
for($i = 0; $i < $length; $i++) { 
$string .= $chars[mt_rand(0, $max)]; 
} 
return $string; 
} 
$HTTP_SESSION=_rand(); 
$HTTP_SESSION; 
$HTTP_Server="search.china.alibaba.com"; 
$HTTP_URL="/company/k-%CB%AE%CB%AE%CB%AE_n-y.html"; 
$ch = curl_init(); 
curl_setopt ($ch,CURLOPT_URL,"http://".$HTTP_Server.$HTTP_URL); 
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); 
curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/4.0
 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR
 2.0.50727)"); 
$res = curl_exec($ch); 
curl_close ($ch); 
print_r($res); 
?>
PHP curl模拟浏览器采集阿里巴巴的实现代码的更多相关文章
- php中curl模拟浏览器来传输数据
		cURL可以使用URL的语法模拟浏览器来传输数据, 因为它是模拟浏览器,因此它同样支持多种协议,FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以 ... 
- curl模拟浏览器进行phpQuery抓取数据
		报Warning: file_get_contents(http://www.dianping.com/shop/8042874) [function.file-get-contents]: fail ... 
- 使用PHP的CURL模拟POST采集开了viewstate的asp.net网页数据
		用.NET做的网站如果做成POST提交方式,且开了viewstate的话,采集起来有点小繁琐,在此跟大家分享一下做法. 采的难点是必須先取得表單裏面的viewstate和datavalidtion兩個 ... 
- 基于Selenium的模拟浏览器采集
		Selenium 也是一个用于Web应用程序测试的工具.Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE(7.8.9).Mozilla Firefox.Mozil ... 
- 使用PHP curl模拟浏览器抓取网站信息
		curl是一个利用URL语法在命令行方式下工作的文件传输工具.curl是一个利用URL语法在命令行方式下工作的文件传输工具.它支持很多协议:FTP, FTPS, HTTP, HTTPS, GOPHER ... 
- 第14.6节 使用Python urllib.request模拟浏览器访问网页的实现代码
		Python要访问一个网页并读取网页内容非常简单,在利用<第14.5节 利用浏览器获取的http信息构造Python网页访问的http请求头>的方法构建了请求http报文的请求头情况下,使 ... 
- curl模拟请求常用参数
		封装一个curl模拟浏览器请求的函数,如下: /** * curl模拟浏览器请求 * @param unknown $url 请求的地址 * @param array $params 请求地址所需要的 ... 
- scrapy模拟浏览器爬取验证码页面
		使用selenium模块爬取验证码页面,selenium模块需要另外安装这里不讲环境的配置,我有一篇博客有专门讲ubuntn下安装和配置模拟浏览器的开发 spider的代码 # -*- coding: ... 
- 第14.7节 Python模拟浏览器访问实现http报文体压缩传输
		一. 引言 在<第14.6节 Python模拟浏览器访问网页的实现代码>介绍了使用urllib包的request模块访问网页的方法.但上节特别说明http报文头Accept-Encodin ... 
随机推荐
- CMS3.0——初次邂逅express
			前言: 刚接手cms3.0的工作,似乎对一切都那么的不熟悉,于是在开始新需求之前,先做一个简单的登录系统. 项目目录: 1.使用webstroms建expreess项目,非常方便简单,建好的项目目录就 ... 
- Win8/8.1下驱动安装“数据无效”错误的有效解决方法
			Windows8.1 安装完vmware 后并没有安装 vmnet1,vmnet8 这两个虚拟网卡,纠结了半天,原来是两个服务没打开. 如果你使用的是Windows8或者8.1,并且精简过系统,那么在 ... 
- java基础---->多线程之wait和notify(八)
			这里学习一下java多线程中的关于wait方法和notify方法的用法.命运不是风,来回吹,命运是大地,走到哪你都在命运中. wait和notify方法的使用 一.wait与notify的简单实例 i ... 
- LeetCode - Department Highest Salary
			题目大概的意思是选出每个Department里工资最高的人的信息并组成相应的表信息 有几个值得注意的地方:1)使用group by语句时,前面的select语句后面的内容只能有两种情况一种是group ... 
- webpack----entry
			入口文件下对象的键值,不多说,上图: 其实app就等同于name,于是乎 dist下的index.html中引入的js,就是: <script type="text/javascrip ... 
- nohop以及后台运行的相关集合
			本文参考:https://blog.csdn.net/u011095110/article/details/78666833 1. 后台运行一个命令: & tar -czvf /mnt/aa. ... 
- js数组的基本用法及数组根据下标(数值或字符)移除元素
			1.创建数组 var array = new Array(); var array = new Array(size);//指定数组的长度 var array = new Array(item1,it ... 
- Oracle下select语句
			先看scott下自带的emp表 empno:编号 ename:名字 Job:职位 mgr:上级编号 hiredate:入职时间 sal:薪水 comm:奖金 deptno:部门编号 部门表dep ... 
- PL/SQL编程基础(一):PL/SQL语法简介(匿名PL/SQL块)
			PL/SQL PL/SQL是Oracle在关系数据库结构化查询语言SQL基础上扩展得到的一种过程化查询语言. SQL与编程语言之间的不同在于,SQL没有变量,SQL没有流程控制(分支,循环).而PL/ ... 
- SmartSprites 智能批量合并 CSS 雪碧图
			做前端的稍微有点经验的都知道 可以通过合并小图片 来减少请求数, 最早可能都是通过 fw.ps 等工具来手动合并, 这种方式的缺点就不吐槽了,效率低,可维护性差 等等 .... 一些很厉害的人,往往会 ... 
