鉴客 C# 抓取页面（带认证）

1. [代码][C#]代码

`01`	`HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create("");`

`02`	`req.UserAgent =` `"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705;)";`

`03`	`req.Method =` `"POST";`

`04`	`req.Accept =` `"text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8";`

`05`	`req.Headers.Add("Accept-Language: en-us,en;q=0.5");`

`06`	`req.Headers.Add("Accept-Encoding: gzip,deflate");`

`07`	`req.Headers.Add("Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7");`

`08`	`req.KeepAlive =` `true;`

`09`	`req.Headers.Add("Keep-Alive: 300");`

`10`	`req.Referer =` `"copy from url";`

11

`12`	`req.ContentType =` `"application/x-www-form-urlencoded";`

13

`14`	`String Username = copy from url;`

`15`	`String PassWord = copy from url;`

16

`17`	`StreamWriter sw =` `new` `StreamWriter(req.GetRequestStream());`

`18`	`sw.Write(string.Format("&loginname={0}&password={1}&btnSubmit=Log In&institutioncode=H4V9KLUT45AV&version=2", Username, PassWord));`

`19`	`sw.Close();`

`20`	`HttpWebResponse response = (HttpWebResponse)req.GetResponse();`

21

`22`	`StreamReader reader =` `new` `StreamReader(response.GetResponseStream());`

`23`	`string` `tmp = reader.ReadToEnd();`

2. [代码]Cookie 处理跳至 [1] [2] [全屏预览]

view source print ?

`01`	`CookieCollection cookiesResponse =` `new` `CookieCollection();`

02

`03`	`if` `(response !=` `null)`

04 {

`05`	`foreach` `(string` `cookie` `in` `response.Headers["Set-Cookie"].Split(';'))`

06 {

`07`	`string` `name = cookie.Split('=')[0];`

`08`	`string` `value = cookie.Substring(name.Length + 1);`

`09`	`cookiesResponse.Add(new` `Cookie(name.Trim(), value.Trim(), path, domain));`

10 }

11 }

鉴客 C# 抓取页面（带认证）的更多相关文章

爬虫抓取页面数据原理（php爬虫框架有很多）
爬虫抓取页面数据原理(php爬虫框架有很多 ) 一.总结 1.php爬虫框架有很多,包括很多傻瓜式的软件 2.照以前写过java爬虫的例子来看,真的非常简单,就是一个获取网页数据的类或者方法(这里的话 ...
用PHP抓取页面并分析
在做抓取前,记得把php.ini中的max_execution_time设置的大点,不然会报错的.
使用PHP的正则抓取页面中的网址
最近有一个任务,从页面中抓取页面中所有的链接,当然使用PHP正则表达式是最方便的办法.要写出正则表达式,就要先总结出模式,那么页面中的链接会有几种形式呢? 链接也就是超级链接,是从一个元素(文字. ...
CasperJS基于PhantomJS抓取页面
CasperJS基于PhantomJS抓取页面 Casperjs是基于Phantomjs的,而Phantom JS是一个服务器端的 JavaScript API 的 WebKit. CasperJS是 ...
2019-1-29-jekyll-如何加密博客-防止抓取
title author date CreateTime categories jekyll 如何加密博客防止抓取 lindexi 2019-01-29 16:26:17 +0800 2018-2- ...
php抓取页面的几种方式
在做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求访问url地址, 然后得到html源代码或者xml数据,得到数据我们不能直接 ...
Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...
php抓取页面的几种方法详解
本篇文章是对php抓取页面的几种方法进行了详细的分析介绍,需要的朋友参考下在做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求 ...
HtmlAgilityPack 抓取页面的乱码处理
HtmlAgilityPack 抓取页面的乱码处理用来解析 HTML 确实方便.不过直接读取网页时会出现乱码. 实际上,它是能正确读到有关字符集的信息,怎么会在输出时,没有取到正确内容. 因此,读两 ...

随机推荐

scala map
map 返回元组下面是如果不存在key 报错 a.(2) 下面两种方式不同的写法. 如果存在 Some(2) 不存在 None a get 2 a.get(2) getOrElse 如果不存在回 ...
DOM操作-动态创建网页元素
动态创建新的DOM元素,是JavaScript操作网页对象模型的重要手段之一代码: <!DOCTYPE html> <html> <head> <title ...
ssh proxy配置
在.ssh目录下新建config文件,并添加以下内容: Host 10.100.101.123 ProxyCommand=nc -X 5 -x [proxyip:proxyport] %h %p
Entity Framework技巧系列之五 - Tip 16 – 19
提示16. 当前如何模拟.NET 4.0的ObjectSet<T> 背景: 当前要成为一名EF的高级用户,你确实需要熟悉EntitySet.例如,你需要理解EntitySet以便使用 At ...
LeetCode OJ 222. Count Complete Tree Nodes
Total Accepted: 32628 Total Submissions: 129569 Difficulty: Medium Given a complete binary tree, cou ...
js纯ajax
var XMLHttpReq; function createXMLHttpRequest() { try { XMLHttpReq = new ActiveXObject("Msxml2. ...
nginx php mysql 集成安装包
经过多次的苦苦寻找,终于找到一款集成了nginx 和mysql php的包.只需一键安装即可. 且可以修改其中的nginx mysql 与php的版本. 解压此文件lnmp???ɰ?n-1.6p-5 ...
Javascript调用 ActiveXObject导出excel文档。
function makeDataBook(){ var xls = new ActiveXObject ("Excel.Application"); xls.visible = ...
Linux网卡配置与绑定
一定要在服务管理中关闭NetworkManager服务并禁用自动启动. 第一步:先查看下本机网卡,使用命令到network-scripts 下 [root@root~]# cd /etc/syscon ...
二分 Intel Code Challenge Elimination Round (Div.1 + Div.2, combined) D
http://codeforces.com/contest/722/problem/D 题目大意:给你一个没有重复元素的Y集合,再给你一个没有重复元素X集合,X集合有如下操作 ①挑选某个元素*2 ②某 ...

鉴客 C# 抓取页面（带认证）

1. [代码][C#]代码

2. [代码]Cookie 处理 跳至 [1] [2] [全屏预览]

鉴客 C# 抓取页面（带认证）的更多相关文章

随机推荐

热门专题

2. [代码]Cookie 处理跳至 [1] [2] [全屏预览]