using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using System.IO;
using System.Collections.Specialized;
using System.Web; namespace Common.Helpers
{
/// <summary>
/// 网络访问辅助类
/// </summary>
public class HttpWebClient : WebClient
{
#region 公共属性
/// <summary>
/// 浏览器用户标识,默认采用Chrome的标识
/// </summary>
public string UserAgent { get; set; }
/// <summary>
/// Cookie容器
/// </summary>
public CookieContainer CookieContainer { get; set; }
/// <summary>
/// 如果 POST 请求需要 100-Continue 响应,则为 true;否则为 false。
/// </summary>
public bool Expect100Continue { get; set; } private WebResponse m_LastWebResponse = null;
/// <summary>
/// 最后一次的响应对象
/// </summary>
public WebResponse LastWebResponse { get { return this.m_LastWebResponse; } } private int m_Timeout = ;
/// <summary>
/// 超时时间,默认120000毫秒(120秒)
/// </summary>
public int Timeout
{
get { return m_Timeout; }
set { m_Timeout = value; }
} private HttpWebClientSetting m_HttpWebClientSetting = null;
/// <summary>
/// WebClient设置项,该属性始终不会为null
/// </summary>
public HttpWebClientSetting HttpWebClientSetting
{
get
{
if (m_HttpWebClientSetting == null)
{
m_HttpWebClientSetting = new HttpWebClientSetting();
}
return m_HttpWebClientSetting;
}
set
{
m_HttpWebClientSetting = value ?? new HttpWebClientSetting();
}
} /// <summary>
/// 预处理Web请求对象的委托方法(会在每次获取WebRequest对象后调用),默认值为null
/// </summary>
public Action<HttpWebRequest> PrepareProcessWebRequest { get; set; }
#endregion #region 构造方法
public HttpWebClient()
: this(new CookieContainer())
{
} public HttpWebClient(CookieContainer cookieContainer)
{
this.CookieContainer = cookieContainer;
this.UserAgent = UserAgentValues.FireFox;
this.Expect100Continue = false;
}
#endregion #region 重写方法,增加对CookieContainer的支持
protected override WebRequest GetWebRequest(Uri address)
{
if (!string.IsNullOrEmpty(this.UserAgent))
{
this.Headers.Add(HttpRequestHeader.UserAgent, this.UserAgent);
} WebRequest request = base.GetWebRequest(address);
request.Timeout = this.Timeout; if (request is HttpWebRequest)
{
HttpWebRequest httpRequest = request as HttpWebRequest;
httpRequest.CookieContainer = this.CookieContainer;
httpRequest.ServicePoint.Expect100Continue = this.Expect100Continue; // 取消100-continue //读取自定义设置项
if (this.HttpWebClientSetting != null)
{
httpRequest.AllowAutoRedirect = this.HttpWebClientSetting.AllowAutoRedirect;
} //使用外部委托属性处理Request对象
if (this.PrepareProcessWebRequest != null)
{
this.PrepareProcessWebRequest(httpRequest);
}
} return request;
}
#endregion #region 重写方法,增加对响应对象的访问
protected override WebResponse GetWebResponse(WebRequest request)
{
WebResponse response = base.GetWebResponse(request);
this.m_LastWebResponse = response;
return response;
}
#endregion #region (public) 向一个URL用POST提交数据,并返回其响应内容 PostData
/// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容
/// ZhangQingFeng 2014-12-14 Add
/// EditLog:
/// ZhangQingFeng 2015-05-12 Edit 因WebClient的UpdateValues方法中固定为UTF-8格式进行UrlEncode,因此此处需用UploadString方式来间接实现 --见微软WebClient类源码UploadValuesInternal方法中
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <param name="encoding">请求所使用的编码</param>
/// <param name="responseEncoding">响应内容所使用的编码,为null时使用请求的编码</param>
/// <returns>响应的内容</returns>
public string PostData(string url, NameValueCollection data, Encoding encoding, Encoding responseEncoding)
{
WebClient client = this; /*
client.Encoding = encoding ?? Encoding.UTF8; byte[] response = client.UploadValues(url, "POST", data ?? new NameValueCollection()); string html = string.Empty; if (responseEncoding == null)
{
html = client.Encoding.GetString(response);
}
else
{
html = responseEncoding.GetString(response);
}
*/ client.Encoding = encoding ?? Encoding.UTF8;
client.Headers.Add(HttpRequestHeader.ContentType, "application/x-www-form-urlencoded"); string delimiter = String.Empty;
StringBuilder values = new StringBuilder();
foreach (string name in data.AllKeys)
{
values.Append(delimiter);
values.Append(HttpUtility.UrlEncode(name, encoding));
values.Append("=");
values.Append(HttpUtility.UrlEncode(data[name], encoding));
delimiter = "&";
} byte[] arrData = client.UploadData(url, "POST", Encoding.ASCII.GetBytes(values.ToString()));
string html = (responseEncoding ?? client.Encoding).GetString(arrData); return html;
} /// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容
/// ZhangQingFeng 2014-12-14 Add
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <param name="encoding">请求和响应所使用的编码</param>
/// <returns>响应的内容</returns>
public string PostData(string url, NameValueCollection data, Encoding encoding)
{
return PostData(url, data, encoding, null);
} /// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容(使用this.Encoding来作请求编码和响应编码)
/// ZhangQingFeng 2014-12-14 Add
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <returns>响应的内容</returns>
public string PostData(string url, NameValueCollection data)
{
return PostData(url, data, this.Encoding);
}
#endregion #region (public) 向一个URL用POST提交数据,并返回其响应内容 PostData
/// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容
/// ZhangQingFeng 2014-12-14 Add
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <param name="encoding">请求和响应内容所使用的编码</param>
/// <returns>响应的内容</returns>
public string PostData(string url, Dictionary<string, string> data, Encoding encoding, Encoding responseEncoding)
{
NameValueCollection postData = new NameValueCollection();
if (data != null)
{
foreach (var item in data)
{
postData.Add(item.Key, item.Value);
}
}
return PostData(url, postData, encoding, responseEncoding);
} /// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容
/// ZhangQingFeng 2014-12-14 Add
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <param name="encoding">请求和响应所使用的编码</param>
/// <returns>响应的内容</returns>
public string PostData(string url, Dictionary<string, string> data, Encoding encoding)
{
return PostData(url, data, encoding, null);
} /// <summary>
/// 向一个URL用POST提交数据,并返回其响应内容(使用this.Encoding来作请求编码和响应编码)
/// ZhangQingFeng 2014-12-14 Add
/// </summary>
/// <param name="url">请求的URL</param>
/// <param name="data">要提交的数据</param>
/// <returns>响应的内容</returns>
public string PostData(string url, Dictionary<string, string> data)
{
return PostData(url, data, this.Encoding);
}
#endregion #region 辅助类
/// <summary>
/// 浏览器用户标识类
/// </summary>
public class UserAgentValues
{
public static readonly string FireFox = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:37.0) Gecko/20100101 Firefox/37.0";
public static readonly string Chrome = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36";
public static readonly string IE8 = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2;)";
}
#endregion
} /// <summary>
/// HttpWebClient对象设置类
/// </summary>
public class HttpWebClientSetting
{
private bool m_AllowAutoRedirect = true;
/// <summary>
/// 当响应内容为重定向时客户端是否自动重定向(如果该属性为true,则取到的响应则为重定向后的内容,否则则为响应原文),默认值为true
/// </summary>
public bool AllowAutoRedirect
{
get { return m_AllowAutoRedirect; }
set { m_AllowAutoRedirect = value; }
}
}
}

HttpWebClient

在做页面抓取的过程中,发现自带的WebClient不够灵活,因此做了一个实现。

关于在PostData方法中不使用UploadValues()方法的原因:

1.查看微软的源代码实现时发现,无论设置请求时的Encoding是否为GB2312,在使用WebClient的UploadValues()上传内容时,其内在都是使用UTF-8编码进行UrlEncode,因此传到服务端中的数据中若包含有中文时则一定会乱码,因此重写PostData以规避此问题。

关于HttpWebClientSetting中的AllowAutoRedirect属性:

在WebClient发起请求时,若响应内容为重定向,则WebClient会自动做重定向,因此该类提供此设置项以控制在访问时是否自动做重定向(第二次访问Refer后的网站时会将请求中的Refer头置空,将该AllowAutoRedirect设置为false,然后手动从Response.Header中取出Location对象地址,设置Refer后再访问,则可真实模拟浏览器访问,从而避开一些网站的防抓取设置)

关于HttpWebClient中的LastWebResponse属性:

当存在多次重定向时,系统记录了最后一次返回的内容,从此内容的Header中取出ResponseUri,则可以取到最后返回响应的页面真实地址,从而为下一次的设置请求Refer头作准备。

大约就是如此,后期如有Bug会继续更新。

支持Cookie并开放了一些特殊设置项的HttpWebClient的更多相关文章

  1. 一行代码让微信小程序支持 cookie

    weapp-cookie 一行代码让微信小程序支持 cookie,传送门:github Intro 微信原生的 wx.request 网络请求接口并不支持传统的 Cookie,但有时候我们现有的后端接 ...

  2. 检测浏览器是否支持cookie方法

    cookie 摘自: http://www.cnblogs.com/fish-li/archive/2011/07/03/2096903.html Cookie是什么? Cookie 是一小段文本信息 ...

  3. cookie的secure、httponly属性设置

    cookie的secure.httponly属性设置 转载自:http://www.cnblogs.com/alanzyy/archive/2011/10/14/2212484.html 一.属性说明 ...

  4. axios 跨域请求允许带cookie,则服务器Access-Control-Allow-Origin应设置为具体域名,否则请求无法获得返回数据

    1.通过允许跨域访问实现了跨域请求,但为了使每个请求带上session信息,我设置了withCredentials ,即: axios.defaults.withCredentials = true ...

  5. IIS 添加mime 支持 apk,exe,.woff,IIS MIME设置 ,Android apk下载的MIME 设置 苹果ISO .ipa下载mime 设置

    原文:IIS 添加mime 支持 apk,exe,.woff,IIS MIME设置 ,Android apk下载的MIME 设置 苹果ISO .ipa下载mime 设置 站点--右键属性--http头 ...

  6. SetCookies, cookie规范注册表和cookie存储将会优先于设置在HTTP客户端级别中默认的那些

    遇到下面问题解决方法: Hey? 404 抱歉,你输入的网址可能不正确,或者该网页不存在. 7 秒后返回首页 使用独立的本地执行上下文来实现对每个用户(或每个线程)状态的管理. 定义在本地内容中的co ...

  7. centos7开放端口和防火墙设置

    centos7开放端口和防火墙设置. 查看防火墙状态: firewall-cmd --state 如果显示: not running 打开防火墙服务: systemctl start firewall ...

  8. 检测浏览器是否支持cookie功能

    <script> if(navigator.cookieEnabled) { document.write("你的浏览器支持cookie功能!"); } else{ d ...

  9. .NET/ASP.NETMVC 大型站点架构设计—迁移Model元数据设置项(自定义元数据提供程序)

    阅读目录: 1.需求背景介绍(Model元数据设置项应该与View绑定而非ViewModel) 1.1.确定问题域范围(可以使用DSL管理问题域前提是锁定领域模型) 2.迁移ViewModel设置到外 ...

随机推荐

  1. 深入理解JavaScript系列:JavaScript的构成

    此篇文章不是干货类型,也算不上概念阐述,就是简单的进行一个思路上的整理. 要了解一样东西或者完成一件事情,首要的就是先要搞清楚他是什么.作为一个前端开发人员,JavaScript应该算作是最核心之一的 ...

  2. 2014西安现场赛F题 UVALA 7040

    地址 题意:求在m种颜色中挑选k种颜色,给n个花朵涂色有几种方法. 分析:画图可以发现,基本的公式就是k ×(k-1)^(n-1).但这仅保证了相邻颜色不同,总颜色数不超过k种,并没有保证恰好出现k种 ...

  3. 关于npm

    转载自AlloyTeam:http://www.alloyteam.com/2016/03/master-npm/ 这是我学npm觉得最好的一篇文章啦-大家一起学起来吧 npm本来是Node.js的包 ...

  4. C#获得网络连接信息 IPGlobalProperties

    IPGlobalProperties 提供有关本地计算机的网络连接的信息. 此类提供有关本地计算机的网络接口和网络连接的配置和统计信息 可以获取本机TCP UDP 丢包 发包等数据. 此类提供的信息与 ...

  5. Ansible-Tower快速入门-6.查看tower的仪表板【翻译】

    查看tower的仪表板 到这一步,我们已经可以在屏幕上看到tower的仪表板了,我们可以看到你目前"主机""资产清单"和"项目"的汇总信息, ...

  6. android view : window

    既然是view,为什么要说window,实际上着是一个很有用的东西,在展现view和设计界面上很有用,就比如说悬浮窗 但是这时候又要分清楚一个概念,window到底是什么?在activity中说过了我 ...

  7. jQuery取得select 选中值和文本 来自园友“大气象”

    本来以为jQuery("#select1").val();是取得选中的值, 那么jQuery("#select1").text();就是取得的文本. 这是不正确 ...

  8. win7绕过开机密码攻略

    访问windows机器,经常会因为忘记了开机密码而苦恼.当然你也可以选择重装,这样最简单粗暴.如果有重要数据保存在C盘之类的(个人严重推荐不要保存到C盘),那就不是重装能解决的问题了.2014年12月 ...

  9. (原创)基于CloudStack的平安云-云主机的生命周期

    一.购买云主机1.条件筛选   涉及环境.应用系统.区域.网络.操作系统.套餐.期限.数量筛选2.校验   2.1 应用系统角色权限校验   2.2 应用系统可用配置校验   2.3 产品区域是否下架 ...

  10. java.lang.ClassCastException: org.slf4j.impl.Log4jLoggerFactory cannot be cast to ch.qos.logback.classic.LoggerContext问题原因及解决方法

    一.错误信息 java.lang.ClassCastException: org.slf4j.impl.Log4jLoggerFactory cannot be cast to ch.qos.logb ...