欢迎訪问个人原创地址: http://www.phpthinking.com/archives/468

使用PHP的cURL库能够简单和有效地去抓网页。

你仅仅须要执行一个脚本。然后分析一下你所抓取的网页。然后就能够以程序的方式得到你想要的数据了。

不管是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,cURL 是一个功能强大的PHP库。本文主要讲述假设使用这个PHP库。

启用 cURL 设置

首先,我们得先要确定我们的PHP是否开启了这个库,你能够通过使用php_info()函数来得到这一信息。

<?php
    phpinfo();
?>

假设你能够在网页上看到以下的输出。那么表示cURL库已被开启。

假设你看到的话,那么你须要设置你的PHP并开启这个库。假设你是在Windows平台下,那么很easy。你须要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号凝视即可了。例如以下所看到的:

//取消下在的凝视
extension=php_curl.dll 

假设你是在Linux以下,那么。你须要又一次编译你的PHP了。编辑时,你须要打开编译參数——在configure命令上加上“–with-curl” 參数。

一个小演示样例

假设一切就绪,以下是一个小例程:

<?

php

// 初始化一个 cURL 对象
$curl =
curl_init(); 
// 设置你须要抓取的URL
curl_setopt($curl,
CURLOPT_URL, 
'http://coolshell.cn');
// 设置header
curl_setopt($curl,
CURLOPT_HEADER, 1);
// 设置cURL 參数,要求结果保存到字符串中还是输出到屏幕上。
curl_setopt($curl,
CURLOPT_RETURNTRANSFER, 1);
// 执行cURL,请求网页
$data =
curl_exec(
$curl);
// 关闭URL请求
curl_close($curl);
// 显示获得的数据
var_dump($data);

怎样POST数据

上面是抓取网页的代码,以下则是向某个网页POST数据。如果我们有一个处理表单的网址http://www.example.com/sendSMS.php。其能够接受两个表单域,一个是电话号码。一个是短信内容。

<?php
    $phoneNumber '13912345678';
    $message 'This
message was generated by curl and php'
;
    $curlPost 'pNUMBER='  .
urlencode(
$phoneNumber)
'&MESSAGE=' .
urlencode(
$message)
'&SUBMIT=Send';
    $ch =
curl_init();
    curl_setopt($ch,
CURLOPT_URL, 
'http://www.example.com/sendSMS.php');
    curl_setopt($ch,
CURLOPT_HEADER, 1);
    curl_setopt($ch,
CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch,
CURLOPT_POST, 1);
    curl_setopt($ch,
CURLOPT_POSTFIELDS, 
$curlPost);
    $data =
curl_exec();
    curl_close($ch);
?

>

从上面的程序我们能够看到。使用CURLOPT_POST设置HTTP协议的POST方法,而不是GET方法,然后以CURLOPT_POSTFIELDS设置POST的数据。

关于代理server

以下是一个怎样使用代理server的演示样例。

请注意当中高亮的代码。代码非常easy,我就不用多说了。
<?php 
    $ch =
curl_init();
    curl_setopt($ch,
CURLOPT_URL, 
'http://www.example.com');
    curl_setopt($ch,
CURLOPT_HEADER, 1);
    curl_setopt($ch,
CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch,
CURLOPT_HTTPPROXYTUNNEL, 1);
    curl_setopt($ch,
CURLOPT_PROXY, 
'fakeproxy.com:1080');
    curl_setopt($ch,
CURLOPT_PROXYUSERPWD, 
'user:password');
    $data =
curl_exec();
    curl_close($ch);
?

>

关于SSL和Cookie

关于SSL也就是HTTPS协议,你仅仅须要把CURLOPT_URL连接中的http://变成https://就能够了。当然,另一个參数叫CURLOPT_SSL_VERIFYHOST能够设置为验证网站。

关于Cookie,你须要了解以下三个參数:

  • CURLOPT_COOKIE,在当面的会话中设置一个cookie
  • CURLOPT_COOKIEJAR。当会话结束的时候保存一个Cookie
  • CURLOPT_COOKIEFILE,Cookie的文件。

HTTPserver认证

最后。我们来看一看HTTPserver认证的情况

<?

php 

    $ch =
curl_init();
    curl_setopt($ch,
CURLOPT_URL, 
'http://www.example.com');
    curl_setopt($ch,
CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch,
CURLOPT_HTTPAUTH, CURLAUTH_BASIC);
    curl_setopt(CURLOPT_USERPWD, '[username]:[password]')
    $data =
curl_exec();
    curl_close($ch);
?>

PHP的curl库代码使用的更多相关文章

  1. linux编译curl库的动态库so(转)

    转载请注明出处:帘卷西风的专栏(http://blog.csdn.NET/ljxfblog) curl库是一个很强大的http开源库,c++里面能够很方便的和http服务器交互. 最近项目开始内测,开 ...

  2. 嵌入式 Linux下curl库API简单介绍

    1:CURLcode curl_global_init(long flags); 这个函数全局需要调用一次(多次调用也可以,不过没有必要), 所以这也是把Curlplus设计成单体类的原因,curl_ ...

  3. php的cURL库介绍

    cURL 是一个利用URL语法规定来传输文件和数据的工具,支持很多协议,如HTTP.FTP.TELNET等.很多小偷程序都是使用这个函数.最爽的是,PHP也支持 cURL 库.本文将介绍 cURL 的 ...

  4. 采用curl库

    Windows通过使用curl库: 到http://curl.haxx.se/下了个curl的源代码下来,源代码是用VC6编译的,我在VS2005下又一次进行编译.竟然仅仅有一个警告. cUrl的实现 ...

  5. ZH奶酪:PHP的cURL库

    原文链接:http://coolshell.cn/articles/664.html 参考链接:http://www.runoob.com/php/php-ref-curl.html 使用PHP的cU ...

  6. CURL库在C++程序中的运用浅析

    最近由于要做一个爬虫项目,要对很多网站进行爬取,所以一直都在看这方面的文章.在翻阅了很多资料后,下载了一个curl库,着实对项目有了很大的帮助. 一.LibCurl基本编程框架 二.一些基本的函数 三 ...

  7. 转:CURL库在程序中的运用浅析

    CURL库在程序中的运用浅析-nk_ysg-ChinaUnix博客 http://blog.chinaunix.net/uid-22476414-id-3286638.html 这个目录的文章转载fr ...

  8. CURL库的宏定义列表

    列表CURL库一共同拥有17个函数 curl_close:关闭CURL会话 curl_copy_handle:复制一个CURL会话句柄,同一时候3复制其全部參数 curl_errno:返回最后一个错误 ...

  9. [转]linux 下 使用 c / c++ 调用curl库 做通信开发

    example:   1. http://curl.haxx.se/libcurl/c/example.html  2. http://www.libcurl.org/book:  1. http:/ ...

随机推荐

  1. eclipse转Android studio遇到的那些坑

           公司项目有导入10多个libray,还有涉及ndk,转Android studio时碰到不少问题.前后大概花费5个工作日,中间各种奇葩bug,各种编译出错,非常多还有没错误提示.一度想过 ...

  2. windows、linux劫持技术

    windows系统以下能够利用detours劫持 realse  模式劫持,调试的程序不能够 函数劫持能够实现的效果. 函数的劫持原理 我们怎样实现-detours detours是微软亚洲研究院出品 ...

  3. Android应用之——自己定义控件ToggleButton

    我们经常会看到非常多优秀的app上面都有一些非常美丽的控件,用户体验非常好.比方togglebutton就是一个非常好的样例,IOS系统以下那个精致的togglebutton现在在android以下也 ...

  4. oracle如何创建数据库

    第一步: 从Windows桌面执行“开始”→“Database Configuration Assistant”命令,打开Database Configuration Assistant对话框的欢迎界 ...

  5. c2

    #include <stdio.h> int main() { // 整型常量 ; // 实型常量(小数) // 单精度float / 双精度double // 注意: 默认情况下编写的小 ...

  6. Docker运行程序报错 WARNING: IPv4 forwarding is disabled. Networking will not work

    WARNING: IPv4 forwarding is disabled. Networking will not work.   第一步:vi /usr/lib/sysctl.d/00-system ...

  7. Spring学习笔记(二) 初探Spring

    版权声明 笔记出自<Spring 开发指南>一书. Spring 初探 前面我们简单介绍了 Spring 的基本组件和功能,现在我们来看一个简单示例: Person接口Person接口定义 ...

  8. POJ 3764 DFS+trie树

    题意: 给你一棵树,求树中最长的xor路径.(n<=100000) 思路: 首先我们知道 A xor B =(A xor C) xor (B xor C) 我们可以随便选一个点DFS 顺便做出与 ...

  9. Python学习——爬虫篇

    requests 使用requests进行爬取                 下面是我编写的第一个爬虫的脚本                   import requests # 导入reques ...

  10. Incorrect integer value: '' for column 'RegNum' at row 1

    数据库版本: 5.6.16​​操作系统: Red Hat Enterprise Linux Server release 6.3 (Santiago)​​在插入数据的时候提示告警:​mysql> ...