ASP.NET抓取网页内容的实现方法

这篇文章主要介绍了ASP.NET抓取网页内容的实现方法,涉及使用HttpWebRequest及WebResponse抓取网页内容的技巧,需要的朋友可以参考下

 一、ASP.NET 使用HttpWebRequest抓取网页内容

 /// <summary>方法一：比较推荐

 /// 用HttpWebRequest取得网页源码

 /// 对于带BOM的网页很有效，不管是什么编码都能正确识别

 /// </summary>

 /// <param name="url">网页地址" </param>

 /// <returns>返回网页源文件</returns>

 public static string GetHtmlSource2(string url)

 {

     //处理内容

     string html = "";

     HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);

     request.Accept = "*/*"; //接受任意文件

     request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.1.4322)"; //

     request.AllowAutoRedirect = true;//是否允许302

     //request.CookieContainer = new CookieContainer();//cookie容器，

     request.Referer = url; //当前页面的引用

     HttpWebResponse response = (HttpWebResponse)request.GetResponse();

     Stream stream = response.GetResponseStream();

     StreamReader reader = new StreamReader(stream, Encoding.Default);  //这里如果出现乱码可以使用 Encoding.GetEncoding("utf-8")处理

html = reader.ReadToEnd(); stream.Close(); return html; }

二、ASP.NET 使用 WebResponse 抓取网页内容

public static string GetHttpData2(string Url)

 {

     string sException = null;

     string sRslt = null;

     WebResponse oWebRps = null;

     WebRequest oWebRqst = WebRequest.Create(Url);

     oWebRqst.Timeout = ;

     try

     {

         oWebRps = oWebRqst.GetResponse();

     }

     catch (WebException e)

     {

         sException = e.Message.ToString();

     }

     catch (Exception e)

     {

         sException = e.ToString();

     }

     finally

     {

         if (oWebRps != null)

         {

             StreamReader oStreamRd = new StreamReader(oWebRps.GetResponseStream(), Encoding.GetEncoding("utf-8"));

             sRslt = oStreamRd.ReadToEnd();

             oStreamRd.Close();

             oWebRps.Close();

         }

     }

     return sRslt;

 }

原文：http://www.jb51.net/article/60740.htm

ASP.NET抓取网页内容的实现方法的更多相关文章

ASP.NET抓取网页内容
原文:ASP.NET抓取网页内容一.ASP.NET 使用HttpWebRequest抓取网页内容这种方式抓取某些页面会失败不过,有时候我们会发现,这个程序在抓取某些页面时,是获不到所需的内容的, ...
ASP.NET 抓取网页内容
(转)ASP.NET 抓取网页内容 ASP.NET 抓取网页内容-文字 ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest. ...
Asp.Net 之抓取网页内容
一.获取网页内容——html ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest.WebResponse.StreamRea ...
C# 抓取网页内容的方法
1.抓取一般内容需要三个类:WebRequest.WebResponse.StreamReader 所需命名空间:System.Net.System.IO 核心代码: view plaincopy ...
Asp 使用 Microsoft.XMLHTTP 抓取网页内容无乱码处理，并过滤须要的内容
Asp 使用 Microsoft.XMLHTTP 抓取网页内容.并过滤须要的内容 Asp 使用 Microsoft.XMLHTTP 抓取网页内容无乱码处理,并过滤须要的内容演示样例源代码: < ...
paip.抓取网页内容--java php python
paip.抓取网页内容--java php python.txt 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http://blog ...
c#抓取网页内容乱码的解决方案
写过爬虫的同学都知道,这是个很常见的问题了,一般处理思路是: 使用HttpWebRequest发送请求,HttpWebResponse来接收,判断HttpWebResponse中”Content-Ty ...
爬虫学习一系列：urllib2抓取网页内容
爬虫学习一系列:urllib2抓取网页内容所谓网页抓取,就是把URL地址中指定的网络资源从网络中读取出来,保存到本地.我们平时在浏览器中通过网址浏览网页,只不过我们看到的是解析过的页面效果,而通过程 ...
asp.net抓取网页html源代码失败只因UserAgent作怪
asp.net抓取网页html源代码,我想对于任何一个asp.net程序员来说都不再陌生,这是一个非常简单容易就能实现的功能.下面便是一个通用的asp.net获得网页源代码的程序. 首先引用 usin ...

随机推荐

Yogurt factory（POJ 2393 贪心 or DP）
Yogurt factory Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 8205 Accepted: 4197 De ...
USB系列之三：从你的U盘里读出更多的内容
U盘是我们最常使用的一种USB设备,本文继续使用DOSUSB做驱动,试图以读取扇区的方式读取你的U盘.本文可能涉及的协议可能会比较多. 一.了解你的U盘首先我们用上一篇文章介绍的程序usbvi ...
分布式文件系统 fastDFS 安装步骤
安装 fastDFS 很简单. 先安装 libevent, 安装成功后,安装fastDFS. ./make.sh ./make.sh install 我使用一台tracker服务器 192.168. ...
在线程中建立Form遇到的问题
一个项目由很多Form组成,默认情况下在启动程序时,这些form都会被建立,这会黑屏很长时间,一种方法是用到Form时再建立,结果又发现如果Form设计复杂,建立的过程也会超过1秒以上,于是想到用线程 ...
python手记(45)
python 声音编辑,减少音量 #!/usr/bin/env python # -*- coding: utf-8 -*- #http://blog.csdn.net/myhaspl #code:m ...
bzoj1649 [Usaco2006 Dec]Cow Roller Coaster
Description The cows are building a roller coaster! They want your help to design as fun a roller co ...
sqlserver 创建索引
语法:CREATE [索引类型] INDEX 索引名称ON 表名(列名)WITH FILLFACTOR = 填充因子值0~100GO /*实例*/ CREATE NONCLUSTERED INDEX ...
HDU 3308 LCIS(线段树单点更新区间合并）
LCIS Given n integers. You have two operations: U A B: replace the Ath number by B. (index counting ...
Scala 函数（五）
函数是一组一起执行一个任务的语句. 您可以把代码划分到不同的函数中.如何划分代码到不同的函数中是由您来决定的,但在逻辑上,划分通常是根据每个函数执行一个特定的任务来进行的. Scala 有函数和方法, ...
uva 714 - Copying Books（贪心最大值最小化二分）
题目描写叙述开头一大堆屁话,我还细致看了半天..事实上就最后2句管用.意思就是给出n本书然后要分成k份,每份总页数的最大值要最小.问你分配方案,假设最小值同样情况下有多种分配方案,输出前面份数小的,就 ...

ASP.NET抓取网页内容的实现方法

ASP.NET抓取网页内容的实现方法的更多相关文章

随机推荐

热门专题