使用libcurl，根据url下载对应html页面

1. [图片] Capture.JPG

2. [代码]GetPageByURL

//static member variable define
string GetPageByURL::m_curPage = "";//当前保存的网页源码
CURL* GetPageByURL::m_curl = NULL;

/************************************************************************/
/* 函数名：Initialize
/* 功能: 初始化libcurl库
/* 返回值：成功，返回true；失败，返回false
/************************************************************************/
bool GetPageByURL::Initialize()
{
curl_global_init(CURL_GLOBAL_ALL);
m_curl = curl_easy_init();
if (m_curl)
{
curl_easy_setopt(m_curl, CURLOPT_FOLLOWLOCATION, 1L);
curl_easy_setopt(m_curl, CURLOPT_WRITEFUNCTION, WriteFunc);
curl_easy_setopt(m_curl, CURLOPT_WRITEDATA, &m_curPage);
}
else
{
MessageBoxA(NULL,"GetPageByURL::Initialize Failed!", "GetPageByURL::Initialize", MB_ICONERROR);
return false;
}
return true;
}

/************************************************************************/
/* 函数名：WriteFunc
/* 功能: libcurl会调用这个标准的函数，
/* size_t function( void *ptr, size_t size, size_t nmemb, void *userdata);
/* 以提供格式化网页数据的机会
/* curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteFunc);
/* 返回值：返回buffer的大小
/************************************************************************/
size_t GetPageByURL::WriteFunc(char *data, size_t size, size_t nmemb, string *writerData)
{
if (writerData == NULL)
return 0;
size_t len = size*nmemb;
writerData->append(data, len);

return len;
}

/************************************************************************/
/* 函数名：GetPage
/* 功能: 根据url，抓取对应的网页源码；使用了libcurl库
/* 返回值：成功，返回包含网页源码的字符串；失败，返回空字符串
/************************************************************************/
bool GetPageByURL::GetPage(
const string& urlStr, //url字符串
string& page //输出参数，返回对应页面源码
)
{
_ASSERT("" != urlStr);
if(!m_curl)
{
MessageBoxA(NULL,"You must initialize curl first!", "GetPageByURL", MB_ICONERROR);
return false;
}

m_curPage.clear();
curl_easy_setopt(m_curl, CURLOPT_URL, urlStr.c_str());
CURLcode res = curl_easy_perform(m_curl);
if(res != CURLE_OK)
{
Utility::MessageBox(NULL, "GetPageByURL::GetPage", MB_ICONERROR, "Get the page of %s failed!", urlStr.c_str());
return false;
}
else
{
page = m_curPage;
return true;
}
}

/************************************************************************/
/* 函数名：Cleanup
/* 功能: 清理内存
/* 返回值：无
/************************************************************************/
void GetPageByURL::Cleanup()
{
if(m_curl)
{
/* always cleanup */
curl_easy_cleanup(m_curl);
m_curl = NULL;
}
}
3. [代码]use it

//use GetPageByURL
GetPageByURL::Initialize();
string page = "";
GetPageByURL::GetPage("http://www.oschina.net/p/curl",page);
GetPageByURL::GetPage("http://www.oschina.net/",page);
GetPageByURL::Cleanup();
4. [文件] GetPageByURL.h
#pragma once
#include <curl/curl.h>

class GetPageByURL
{
public:
GetPageByURL(void);
public:
~GetPageByURL(void);
private:
static string m_curPage;
static CURL *m_curl;
private:
static size_t WriteFunc(char *data, size_t size, size_t nmemb, string *writerData);
public:
static bool Initialize();
static bool GetPage(const string& urlStr, string& page);
static void Cleanup();
};
5. [文件] GetPageByURL.cpp
#include "StdAfx.h"
#include "GetPageByURL.h"

//static member variable define
string GetPageByURL::m_curPage = "";//当前保存的网页源码
CURL* GetPageByURL::m_curl = NULL;

GetPageByURL::GetPageByURL(void)
{http://www.enterdesk.com/special/shouhui/
}手绘图片

GetPageByURL::~GetPageByURL(void)
{
}

/************************************************************************/
/* 函数名：Initialize
/* 功能: 初始化libcurl库
/* 返回值：成功，返回true；失败，返回false
/************************************************************************/
bool GetPageByURL::Initialize()
{
curl_global_init(CURL_GLOBAL_ALL);
m_curl = curl_easy_init();
if (m_curl)
{
curl_easy_setopt(m_curl, CURLOPT_FOLLOWLOCATION, 1L);
curl_easy_setopt(m_curl, CURLOPT_WRITEFUNCTION, WriteFunc);
curl_easy_setopt(m_curl, CURLOPT_WRITEDATA, &m_curPage);
}
else
{
MessageBoxA(NULL,"GetPageByURL::Initialize Failed!", "GetPageByURL::Initialize", MB_ICONERROR);
return false;
}
return true;
}

/************************************************************************/
/* 函数名：WriteFunc
/* 功能: libcurl会调用这个标准的函数，
/* size_t function( void *ptr, size_t size, size_t nmemb, void *userdata);
/* 以提供格式化网页数据的机会
/* curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteFunc);
/* 返回值：返回buffer的大小
/************************************************************************/
size_t GetPageByURL::WriteFunc(char *data, size_t size, size_t nmemb, string *writerData)
{
if (writerData == NULL)
return 0;
size_t len = size*nmemb;
writerData->append(data, len);

return len;
}

/************************************************************************/
/* 函数名：GetPage
/* 功能: 根据url，抓取对应的网页源码；使用了libcurl库
/* 返回值：成功，返回包含网页源码的字符串；失败，返回空字符串
/************************************************************************/
bool GetPageByURL::GetPage(
const string& urlStr, //url字符串
string& page //输出参数，返回对应页面源码
)
{
_ASSERT("" != urlStr);
if(!m_curl)
{
MessageBoxA(NULL,"You must initialize curl first!", "GetPageByURL", MB_ICONERROR);
return false;
}

m_curPage.clear();
curl_easy_setopt(m_curl, CURLOPT_URL, urlStr.c_str());
CURLcode res = curl_easy_perform(m_curl);
if(res != CURLE_OK)
{
Utility::MessageBox(NULL, "GetPageByURL::GetPage", MB_ICONERROR, "Get the page of %s failed!", urlStr.c_str());
return false;
}
else
{
page = m_curPage;
return true;
}
}

/************************************************************************/
/* 函数名：Cleanup
/* 功能: 清理内存
/* 返回值：无
/************************************************************************/
void GetPageByURL::Cleanup()
{
if(m_curl)
{
/* always cleanup */
curl_easy_cleanup(m_curl);
m_curl = NULL;
}
}

使用libcurl，根据url下载对应html页面的更多相关文章

根据url下载图片和页面
需要将&tp=webp&wxfrom=5去掉,既可以在任何地方显示,也可以下载了 http://mmbiz.qpic.cn/mmbiz_jpg/bf8pC39RBhGFOH1ib9Ac ...
js通过 URL下载文件
页面上一个button,点击之后触发一个function去请求数据,返回 pdf/epub 的URL,然后下载这个文件. 本来是直接用 a 写的,href里放资源地址,target设为'_blank' ...
wget---从指定的URL下载文件
wget命令用来从指定的URL下载文件.wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性,如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕.如果是服务器打断下 ...
node.js入门学习（二）MIME模块，request和response对象，demo之不同url请求不同html页面，页面包含图片、样式css等静态资源
一.构建http服务程序-根据不同请求做出不同响应 // 加载http模块 var http = require("http"); // 创建一个http服务对象 http.cre ...
C++根据图片url下载图片
需要使用到URLDownloadToFile()函数,该函数在头文件<urlmon.h>中声明. URLDownloadToFile()函数的定义如下: HRESULT URLDownlo ...
从指定的URL下载文件
通过使用URLDownLoadToFile函数,我们能从指定的URL下载文件,保存到本地,并且下载的文件类型可以是可执行文件实例如下,http://www.xuexic.com 的根目录下存在一个l ...
Java和Android Http连接程序：使用java.net.URL 下载服务器图片到客户端
Java和Android Http连接程序:使用java.net.URL 下载服务器图片到客户端本博客前面博文中利用org.apache.http包中API进行Android客户端HTTP连接的例子 ...
使用url下载网络图片以及流介绍
使用url下载网络图片的时候,首先需要建立一个URL对象,然后使用一个输入流获取该URL中的内容.之后使用读取该输入流的内容,使用一个输出流写到本地文件中.最后关闭输入和输出流.下面是一个简单的下载代 ...
QT实现，通过URL下载文件的接口实现
今天来把坑填上. 具体就是提供一个URL,并通过这个URL下载文件. MyDownloader.h: #ifndef MYDOWNLOADER_H #define MYDOWNLOADER_H cla ...

随机推荐

24. Spring Boot环境变量读取和属性对象的绑定【从零开始学Spring Boot】
转:http://blog.csdn.net/linxingliang/article/details/52069509 凡是被spring管理的类,实现接口EnvironmentAware 重写方法 ...
【BIEE】BIEE报表根据维度表展示事实表不存在的维度
事实表数据维度表数据现在报表展示如下: 这样展示报表让人感觉数据缺失了,需要显示成如下样子,感觉会比较舒服一点那么,如何实现上面的完美操作呢? 实现步骤分析编辑页面→表视图属性→包含仅具有空行 ...
jQuery与ajax的应用（一）
<body> <div id="resText"></div> <div id="reshtml"></d ...
HTML5 手机网页制作笔记
http://top.css88.com/archives/546 http://www.w3cfuns.com/blog-5470280-5406828.html 最近在卓手机网页,第一次入手.把要 ...
mysql解决中文乱码
mysql>use mydb; mysql>alter database mydb character set utf8;! 这种方法只对设置后重新创建的表有效,对已存在的表无效 des ...
php正则表达式匹配img中任意属性的方法
经常和图片打交道,不得不用到一些提取图片中scr.alt.title.等的属性,这里总结给大家一些常用的,感觉还不错,比较通用! PHP正则表达式匹配img中任意属性PHP 复制代码代码如下: < ...
将web工程部署到tomcat
http://blog.csdn.net/lucklq/article/details/7621807 http://jingyan.baidu.com/article/466506582f2f4af ...
maven新建项目报错
创建了一个maven项目,报错 Errors occurred during the build. Errors running builder 'Maven Project Builder' on ...
JAVA中两个Set比较找出交集、差集、并集
当做到某些功能的时候,使用Set能够快速方便地将需要的类型以集合类型保存在一个变量中,Set是最简单的一种集合,集合中的对象不按特定的方式排序,并且没有重复对象. //两个Set比较找出交集.差集.并 ...
22 nginx配置与集群
一:编译nginx ,并配置 Cd /app/pcre-8.12 ./configure Make && make install Cd nginx-1.2.7 ./configure ...

使用libcurl，根据url下载对应html页面

1. [图片] Capture.JPG

使用libcurl，根据url下载对应html页面的更多相关文章

随机推荐

热门专题