浏览器自动化的一些体会3 webBrowser控件之零碎问题

1. 一般需要执行这一句：webBrowser1.ScriptErrorsSuppressed = true;

主要目的是禁止跳出javascript错误的对话框，否则会导致程序无法正确地跑下去。缺点显然是某些真正的javascript错误被掩盖了。但是实践中觉得多数情况下，这一句是有必要的。

2. 解析dom

webBrowser控件提供了一些解析dom的方法，如webBrowser1.Document.GetElementById()。这些方法在处理某些结构较为复杂的dom时会显得不太方便，这时我一般喜欢用HtmlAgilityPack这个库来解析dom。

HtmlAgilityPack很强大，但有一个很大问题是，webBrowser里的方法找到所需元素后，可以执行Click等操作，而HtmlAgilityPack不行(因为它不能执行javascript)。所以在需要Click等操作时，我一般用webBrower控件提供的方法，或者干脆换用selenium的webdriver（以后讨论）。

3. 保存图片

主要有两种方法（如果把本贴里第5条的“另存为”也算上，可说有3种方法），一种是先解析dom，获取图片url，然后发httprequest/用webclient下载图片：

https://social.msdn.microsoft.com/Forums/en-US/3cce6004-2b04-46f4-ac2e-b16a9852d62d/how-to-save-imagepicture-from-webbrowser-control?forum=ieextensiondevelopment

主要问题是某些网站需要cookie或其他header时，这种方法就较为麻烦。

另外一种是利用剪贴板：

https://stackoverflow.com/questions/3833718/webbrowser-copy-image-to-clipboard/3833846#3833846

实践中碰到的主要问题是难以保留图片的格式，比如图片本来是png格式，保存后，不管

Bitmap bmp = (Bitmap) Clipboard.GetDataObject().GetData(DataFormats.Bitmap)中的DataFormat设成什么，都无法存成png格式（将保存后文件的大小和直接从网页中“另存为”保存的文件大小对比可看出）。这个问题不知道如何解决。高明教我。

4. session问题

在winform中如果用多个tabpage里的webBrowser控件同时打开同一个url，如果该网站用了session，那么，这几个tabpage里的webBrowser控件将“共享”同一个session。这个有点坑爹。下面用代码来说明：

winform里的代码：

private void winWeb_Load(object sender, EventArgs e)

{//winWeb是个winform，放在一个tabpage里，包含了一个webBrowser控件，这里在load事件中Navigate

            string url = "http://abc.com?a=test";

            int count = Util.GetCount();//Util类里记录当前最大的count值

            count++;//每调用一次(也就是新开一个tabpage)加1

            url += "&count=" + count.ToString();//传给网页，用于区分不同tabpage的session

            webBrowser1.Navigate(url);

}

网页（asp.net webform）里的代码：

protected void Page_Load(object sender, EventArgs e)

{

                    string count = Request.QueryString["count"];

                    if (String.IsNullOrEmpty(count))

                    {

                        count = "";

                    }

                    ViewState["Count"] = count;//保存在ViewState里，因为网页其他部分也要用

                    int pID = Convert.ToInt32(Request.QueryString["pid"]);

                    Session[ViewState["Count"].ToString() + "SelectedOID"] = pID;//创建session,用count值来实现不同tabpage打开的网页有不同的session，否则就“共享” session了                  

}

5. “另存为”

如何用代码来实现浏览器里右击鼠标，然后点“另存图片为”的行为？如果用的是webBrowser控件，似乎没有太好的办法，只能估算屏幕坐标，然后模拟鼠标行为，这里贴一段虽然work（针对程序中所处理的网页而言，如果用在别的网页中，显然要做一点修改），但显然很笨拙的代码：

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)

{

                timer1.Stop();

                timer1.Start();

}

        private void timer1_Tick(object sender, EventArgs e)

        {

            timer1.Stop();

            Point controlLoc = this.PointToScreen(webBrowser1.Location);

            controlLoc.X = controlLoc.X + webBrowser1.Document.GetElementById("memu6").OffsetRectangle.Left + ;//找到鼠标右击的位置

            controlLoc.Y = controlLoc.Y + webBrowser1.Document.GetElementById("memu6").OffsetRectangle.Top + ;

            Cursor.Position = controlLoc;

            MouseAndKeySimulator.ClickRightMouseButton();//MouseAndKeySimulator顾名思义是一个模拟鼠标和键盘时间的第三方类，代码这里就不贴了

            timer2.Stop();//因为是模拟点击，需要有一定的延时，这里用timer实现

            timer2.Start();

        }

        private void timer2_Tick(object sender, EventArgs e)

        {

            timer2.Stop();

            var newX = Cursor.Position.X + ;

            Point newPoint = new Point();

            newPoint.X = newX;

            newPoint.Y = Cursor.Position.Y;

            Cursor.Position = newPoint;

            MouseAndKeySimulator.PressKey(Keys.G, true);

            MouseAndKeySimulator.PressKey(Keys.G, false);//模拟键盘操作，下移到“图片”菜单项

            for (int i = ; i < ; i++)

            {//模拟键盘操作，下移到“另存图片为”菜单项

                MouseAndKeySimulator.PressKey(Keys.Up, true);

                MouseAndKeySimulator.PressKey(Keys.Up, false);

            }

            MouseAndKeySimulator.PressKey(Keys.Enter, true);//打开“保存图片”对话框

            MouseAndKeySimulator.PressKey(Keys.Enter, false);

            timer3.Stop();//打开对话框也需要延时

            timer3.Start();

        }

        private void timer3_Tick(object sender, EventArgs e)

        {

            timer3.Stop();

            MouseAndKeySimulator.PressKey(Keys.Enter, true);//用缺省的文件名保存图片，如果要换名保存，这里还得模拟键盘输入文件名

            MouseAndKeySimulator.PressKey(Keys.Enter, false);

            timer4.Stop();//这个是为了处理下一个图片的，代码这里从略

            timer4.Start();

        }

以后再讨论selenium的webdriver时，可能还会提到类似功能，就会发现实现起来容易多了。在模拟鼠标和键盘行为方面，webBrowser控件没有提供什么支持，实现起来比较费劲。

浏览器自动化的一些体会3 webBrowser控件之零碎问题的更多相关文章

浏览器自动化的一些体会9 webBrowser控件之零碎问题3
WebBrowser控件最大的优点是可以轻松嵌入win form程序中,但是微软好像对这个控件没什么兴趣,这么多年了还没有改进,结果造成一堆问题. 1. 不支持https 2. 缺省模拟ie 7,如果 ...
浏览器自动化的一些体会4 webBrowser控件之零碎问题2
1. DocumentCompleted的多次执行问题有的网页,会多次触发DocumentCompleted事件,由于它是异步的,不会阻塞,所以如果不恰当处理,会造成某些代码被错误地多次执行,造成意 ...
浏览器自动化的一些体会2 webBrowser控件之ajax
上个帖子简要讨论了浏览器自动化的几种方法.现在讨论webBrowser控件使用中的一些问题.基本的操作就不详细说了,随便网上找个帖子或找本书都有介绍的.这里只写点网上似乎少有人总结过的内容,以及自己的 ...
浏览器自动化的一些体会5 webBrowser控件之winform和webBrowser的交互
从winform访问webBrowser,大致就是利用webBrowser提供的解析dom的方法以及用InvokeScript方法执行javascript.这个相对比较简单. 从webBrowser访 ...
Webbrowser控件史上最强技巧全集
原文:Webbrowser控件史上最强技巧全集 Webbrowser控件史上最强技巧全集 VB调用webbrowser技巧集 1.获得浏览器信息: Private Sub Command1_Click ...
WebBrowser控件使用详解
原文:WebBrowser控件使用详解方法说明 GoBack 相当于IE的“后退”按钮,使你在当前历史列表中后退一项 GoForward 相当于IE的“前进”按钮,使你在当前历史列表中前进一项 G ...
浏览器自动化的一些体会6 增强的webBrowser控件
这里谈两点 1.支持代理服务器切换一种方法是修改注册表,不是太好的做法,而且,只能改全局设置,不能改局部(比如只让当前的webBrowser控件使用代理,而其他应用不用代理) 另外一个较好的方法,示 ...
浏览器自动化的一些体会9 访问angular页面的一个问题
发现浏览器自动化有一个重要方面没有提及,即所谓的无页面浏览器,不过最近没有需求,不想尝试,先记上一笔,以后有需求时,可以有个思路. 大约一两个月前(现在比较懒散,时间不知不觉过去,连今天是几号有时候都 ...
PB打开ole控件IE浏览器版本问题_指定Webbrowser控件所用IE内核版本(转)
如果电脑上安装了IE8或者之后版本的IE浏览器,Webbrowser控件会使用IE7兼容模式来显示网页内容.解决方法是在注册表中为你的进程指定引用IE的版本号. 比如我的程序叫做a.exe 对于32位 ...

随机推荐

题解 CF13E 【Holes】
这个题和$P3203\ $弹飞绵羊基本上完全一致我的做法是用$LCT$维护信息,开一个节点$fly$,表示到此节点时,小球会弹飞,那么查询弹多少次即为$siz[fly]-1$ 最后一次落 ...
xshell如果通过跳板机登录其他机器
首先,跳板机设置隧道目标机器,选择刚才的隧道作为代理
three.js 数学方法之Matrix3
今天郭先生来说一说three.js的三维矩阵,这块知识需要结合线性代数的一些知识,毕业时间有点长,线性代数的知识大部分都还给了老师.于是一起简单的复习了一下.所有的计算都是使用列优先顺序进行的.然而, ...
C语言中的 “>>”与“<<”
1. ">>" int x = 16; printf("%d\n", x >> 1); 先将x转成二进制 10000, 不读最后一位, ...
JavaScript 中的模块化
JavaScript 中的模块化最早的基于立即执行函数,闭包的模块化 const MountClickModule = function(){ let num = 0; const handle ...
Apple产品价钱分析
express，node.js实现获取本地文件夹下面的全部图片文件
http://www.luyixian.cn/javascript_show_169354.aspx 按照网上的教程试了多次,处理了各种结果后还有报错, 最后的报错是cant find module ...
yield 复习
1.协程,微型进程: yield 生成器 yield 会保存声明的变量,可以进行迭代使用接收函数返回的对象.__next__() next(接收函数返回的对象) .send() 方法传递给函数中 ...
Win10系统安装MySQL Workbench 8
系统:Window10 专业版 MySQL Workbench 8.0.19 下载地址:https://dev.mysql.com/downloads/workbench/8.0.html 点击Dow ...
MySQL的utf8问题
作者:brightwang 原文:https://www.jianshu.com/p/ab9aa8d4df7d 有时候用MySQL存储一些特殊字符时,有出现乱码问题. 我用的是UTF-8编码的客户端, ...

浏览器自动化的一些体会3 webBrowser控件之零碎问题

浏览器自动化的一些体会3 webBrowser控件之零碎问题的更多相关文章

随机推荐

热门专题