C# webrequest 抓取数据时，多个域Cookie的问题

最近研究了下如何抓取为知笔记的内容，在抓取笔记里的图片内容时，老是提示403错误，用Chorme的开发者工具看了下：

这里的Cookie来自两个域，估计为知那边是验证了token(登录后才能获取到token)

下载图片的代码：

var path = "https://note.wiz.cn/" + str.TrimStart('/');
var extension = Path.GetExtension(path);
var filepath = AppPath.Combine("Images/" + DateTime.Now.Ticks + extension);
const string userAgent ="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36";
const string accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
const string acceptLanguage = "zh-CN,zh;q=0.8";
const string acceptEncoding = "gzip,deflate,sdch";
var cookieContainer = new CookieContainer();
var cookie = new Cookie
{
Name = "token".Trim(),
Value = Token,
Domain = ".wiz.cn".Trim() //设置cookie域
};
cookieContainer.Add(cookie);
string[] cookiesArr = txtCookie.Text.Split(';');
foreach (string s in cookiesArr)
{
string[] keyValuePair = s.Split('=');
if (keyValuePair.Length > 1)
{
cookie = new Cookie
{
Name = keyValuePair[0].Trim(),
Value = keyValuePair[1].Trim(),
Domain = "note.wiz.cn" //设置cookie域
};
cookieContainer.Add(cookie);
}
}
var newUri = new Uri(path);
var webRequest = (HttpWebRequest)WebRequest.Create(newUri);
webRequest.Timeout = 20000;
//webRequest.CookieContainer = cookieContainer;
webRequest.UserAgent = userAgent;
webRequest.Accept = accept;
webRequest.Headers["Accept-Language"] = acceptLanguage;
webRequest.Headers["Accept-Charset"] = acceptEncoding;
webRequest.Headers["Accept-Encoding"] = acceptEncoding;
webRequest.KeepAlive = true;
webRequest.Headers["Cache-Control"] = "no-cache";
webRequest.Headers["Upgrade-Insecure-Requests"] = "1";
webRequest.Headers["Pragma"] = "no-cache";
webRequest.Headers["Cookie"] = "token=" + Token + ";" + txtCookie.Text.Trim();//todo: Cookie 要这样赋值，不能用CookieContainer？？
webRequest.Referer = newUri.AbsoluteUri;
HttpWebResponse rsp = (HttpWebResponse)webRequest.GetResponse();
Stream stream = null;
stream = rsp.GetResponseStream();
Image.FromStream(stream).Save(filepath);
// 释放资源
if (stream != null) stream.Close();
if (rsp != null) rsp.Close();

奇怪的是：用 webRequest.CookieContainer = cookieContainer; 来跟cookie赋值，token参数总是赋不上，

后面改为：webRequest.Headers["Cookie"] = "token=" + Token + ";" + txtCookie.Text.Trim(); 就可以了，

CookieContainer 不是支持多个域的cookie吗，难到跨域Cookie只能webRequest.Headers["Cookie"]这样赋值吗？没弄明白，有知道的童鞋不吝赐教。

C# webrequest 抓取数据时，多个域Cookie的问题的更多相关文章

jsoup使用样式class抓取数据时空格的处理
最近在研究用android和jsoup抓取小说数据,jsoup的使用可以参照http://www.open-open.com/jsoup/;在抓纵横中文网永生这本书的目录内容时碰到了问题, 永生的书简 ...
C# 从需要登录的网站上抓取数据
[转] C# 从需要登录的网站上抓取数据背景:昨天一个学金融的同学让我帮她从一个网站上抓取数据,然后导出到excel,粗略看了下有1000+条记录,人工统计的话确实不可能.虽说不会,但作为一个学计算 ...
Java模拟新浪微博登陆抓取数据
前言: 兄弟们来了来了,最近有人在问如何模拟新浪微博登陆抓取数据,我听后默默地抽了一口老烟,暗暗的对自己说,老汉是时候该你出场了,所以今天有时间就整理整理,浅谈一二. 首先: 要想登陆新浪微博需要 ...
测试开发Python培训：抓取新浪微博抓取数据-技术篇
测试开发Python培训:抓取新浪微博抓取数据-技术篇 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在poptest的se ...
C#抓取数据、正则表达式+线程池初步运用
去年底用多线程+HtmlAgilityPack.dll 写了一个抓取“慧聪网” 公司信息的小程序,代码惨不忍赌.好在能抓到数据,速度也能让人忍受就很久没管了. 最近这段时间把这个小程序发给同事看着玩 ...
PHP Curl模拟登录并抓取数据
使用PHP的Curl扩展库可以模拟实现登录,并抓取一些需要用户账号登录以后才能查看的数据.具体实现的流程如下(个人总结): 1. 首先需要对相应的登录页面的html源代码进行分析,获得一些必要的信息: ...
爬虫学习笔记（1）-- 利用Python从网页抓取数据
最近想从一个网站上下载资源,懒得一个个的点击下载了,想写一个爬虫把程序全部下载下来,在这里做一个简单的记录 Python的基础语法在这里就不多做叙述了,黑马程序员上有一个基础的视频教学,可以跟着学习一 ...
Web Scraper 翻页——控制链接批量抓取数据
![](https://image-1255652541.cos.ap-shanghai.myqcloud.com/images/20190708214014.png) 这是简易数据分析系列的第 5 ...
Web Scraper 翻页——控制链接批量抓取数据（Web Scraper 高级用法）| 简易数据分析 05
这是简易数据分析系列的第 5 篇文章. 上篇文章我们爬取了豆瓣电影 TOP250 前 25 个电影的数据,今天我们就要在原来的 Web Scraper 配置上做一些小改动,让爬虫把 250 条电影数据 ...

随机推荐

div中添加滚动条
<div style="position:absolute; height:400px; overflow:auto"></div>div 设置滚动条显示: ...
HDU 1229 还是A+B（A+B陶冶情操）
题目连接:http://acm.hdu.edu.cn/showproblem.php?pid=1229 解题报告:A+B #include<cstdio> int main() { int ...
docker之容器访问和网络连接(三)
前言当一台服务器上部署了多个应用容器,它们直接可能需要相互通信,比如web应用容器需要访问mysql数据库容器. 主机访问容器通过映射端口的形式我们可以在外部访问容器内的服务 # 将主机的127. ...
Jquery ajax json 不执行success的原因坑爹
最近在看jQuery的API文档,在使用到jQuery的ajax时,如果指定了dataType为json,老是不执行success回调,而是执行了error回调函数,极度郁闷.后面改为1.2.6版本可 ...
在阿里云申请Symantec免费SSL证书操作流程
2016年阿里云与国内证书颁发机构天威诚信推出了基于Symantec(赛门铁克)的免费SSL证书,有需要免费SSL证书产品的可以前往阿里云进行申请. 申请地址:阿里云云盾证书服务—Symantec免费 ...
android4.0后无法向Servlet发送请求解决办法
从4.0开始,强制性地规定网络堵塞任务都不能放在ui线程,不然直接报错. 个办法,在oncreate下面加入 StrictMode.setThreadPolicy(new StrictMode.Thr ...
appium入门级教程（3）—— 安装 Android SDK
前言搭建Android平台不是必须的,如果你不想使用 Android 模拟器运行测试的话可以跳过,不过,建议安装:原生 Android 好折腾!关键是它自带的一些工具是做 appium 测试必须要用 ...
ctrl+c ctrl+d ctrl+z 的区别和使用场景
三者的区别 Ctrl+C :强制中断程序,程序无论运行哪里都停止. Ctrl+D :发送一个 exit 的信号,退出当前的用户或者是客户端. Ctrl+Z :暂停程序,在进程中维持挂起状态. 引用别人 ...
Linux下安装matlab2014a
下载Matlab 我放在百度云盘里了,下载链接: http://pan.baidu.com/s/1pLE1qgr 密码: x4tw 该文件下载解压后如下所示:该文件下载解压后如下所示: 注意linux ...
canvas版《俄罗斯方块》
试玩(没有考虑兼容低版本浏览器): See the Pen Canvas俄罗斯方块 by 王美建 (@wangmeijian) on CodePen. ************************ ...

C# webrequest 抓取数据时，多个域Cookie的问题

C# webrequest 抓取数据时，多个域Cookie的问题的更多相关文章

随机推荐

热门专题