C#彻底解决Web Browser 跨域读取Iframes内容

用C# winform的控件web browser 读取网页内容,分析一下数据,做一些采集工作。

如果是同一个域名下面还是好办的,基本上用HtmlAgilityPack就完全可以解决问题。

但是现在遇到跨域问题,比如我需要打开页面上存在的广告联盟的地址,进行保存。

这就是牵扯到跨域。

一般的错误是:拒绝访问。

"Access is denied. (Exception from HRESULT: 0x80070005 (E_ACCESSDENIED))"。

因为你没有在这个网站去修改另一个网站数据的权利。

怎么办?很困恼吧。现在就告诉大家一个好办法。

直接上代码了。

工具类,大家保存成一个类。需要引用mshtml

using System;

using System.Runtime.InteropServices;

using System.Windows.Forms;

using mshtml;

namespace WebBrowserTest

{

// This is the COM IServiceProvider interface, not System.IServiceProvider .Net interface!

[ComImport(), ComVisible(true), Guid("6D5140C1-7436-11CE-8034-00AA006009FA"),

InterfaceTypeAttribute(ComInterfaceType.InterfaceIsIUnknown)]

public interface IServiceProvider

{

[return: MarshalAs(UnmanagedType.I4)]

[PreserveSig]

int QueryService(ref Guid guidService, ref Guid riid, [MarshalAs(UnmanagedType.Interface)] out object ppvObject);

}

public enum OLECMDF

{

OLECMDF_DEFHIDEONCTXTMENU = 0x20,

OLECMDF_ENABLED = 2,

OLECMDF_INVISIBLE = 0x10,

OLECMDF_LATCHED = 4,

OLECMDF_NINCHED = 8,

OLECMDF_SUPPORTED = 1

}

public enum OLECMDID

{

OLECMDID_PAGESETUP = 8,

OLECMDID_PRINT = 6,

OLECMDID_PRINTPREVIEW = 7,

OLECMDID_PROPERTIES = 10,

OLECMDID_SAVEAS = 4

}

public enum OLECMDEXECOPT

{

OLECMDEXECOPT_DODEFAULT,

OLECMDEXECOPT_PROMPTUSER,

OLECMDEXECOPT_DONTPROMPTUSER,

OLECMDEXECOPT_SHOWHELP

}

[ComImport, Guid("D30C1661-CDAF-11d0-8A3E-00C04FC9E26E"), TypeLibType(TypeLibTypeFlags.FOleAutomation | TypeLibTypeFlags.FDual | TypeLibTypeFlags.FHidden)]

public interface IWebBrowser2

{

[DispId(100)]

void GoBack();

[DispId(0x65)]

void GoForward();

[DispId(0x66)]

void GoHome();

[DispId(0x67)]

void GoSearch();

[DispId(0x68)]

void Navigate([In] string Url, [In] ref object flags, [In] ref object targetFrameName, [In] ref object postData, [In] ref object headers);

[DispId(-550)]

void Refresh();

[DispId(0x69)]

void Refresh2([In] ref object level);

[DispId(0x6a)]

void Stop();

[DispId(200)]

object Application { [return: MarshalAs(UnmanagedType.IDispatch)] get; }

[DispId(0xc9)]

object Parent { [return: MarshalAs(UnmanagedType.IDispatch)] get; }

[DispId(0xca)]

object Container { [return: MarshalAs(UnmanagedType.IDispatch)] get; }

[DispId(0xcb)]

object Document { [return: MarshalAs(UnmanagedType.IDispatch)] get; }

[DispId(0xcc)]

bool TopLevelContainer { get; }

[DispId(0xcd)]

string Type { get; }

[DispId(0xce)]

int Left { get; set; }

[DispId(0xcf)]

int Top { get; set; }

[DispId(0xd0)]

int Width { get; set; }

[DispId(0xd1)]

int Height { get; set; }

[DispId(210)]

string LocationName { get; }

[DispId(0xd3)]

string LocationURL { get; }

[DispId(0xd4)]

bool Busy { get; }

[DispId(300)]

void Quit();

[DispId(0x12d)]

void ClientToWindow(out int pcx, out int pcy);

[DispId(0x12e)]

void PutProperty([In] string property, [In] object vtValue);

[DispId(0x12f)]

object GetProperty([In] string property);

[DispId(0)]

string Name { get; }

[DispId(-515)]

int HWND { get; }

[DispId(400)]

string FullName { get; }

[DispId(0x191)]

string Path { get; }

[DispId(0x192)]

bool Visible { get; set; }

[DispId(0x193)]

bool StatusBar { get; set; }

[DispId(0x194)]

string StatusText { get; set; }

[DispId(0x195)]

int ToolBar { get; set; }

[DispId(0x196)]

bool MenuBar { get; set; }

[DispId(0x197)]

bool FullScreen { get; set; }

[DispId(500)]

void Navigate2([In] ref object URL, [In] ref object flags, [In] ref object targetFrameName, [In] ref object postData, [In] ref object headers);

[DispId(0x1f5)]

OLECMDF QueryStatusWB([In] OLECMDID cmdID);

[DispId(0x1f6)]

void ExecWB([In] OLECMDID cmdID, [In] OLECMDEXECOPT cmdexecopt, ref object pvaIn, IntPtr pvaOut);

[DispId(0x1f7)]

void ShowBrowserBar([In] ref object pvaClsid, [In] ref object pvarShow, [In] ref object pvarSize);

[DispId(-525)]

WebBrowserReadyState ReadyState { get; }

[DispId(550)]

bool Offline { get; set; }

[DispId(0x227)]

bool Silent { get; set; }

[DispId(0x228)]

bool RegisterAsBrowser { get; set; }

[DispId(0x229)]

bool RegisterAsDropTarget { get; set; }

[DispId(0x22a)]

bool TheaterMode { get; set; }

[DispId(0x22b)]

bool AddressBar { get; set; }

[DispId(0x22c)]

bool Resizable { get; set; }

}

class CorssDomainHelper

{

private static Guid IID_IWebBrowserApp = new Guid("0002DF05-0000-0000-C000-000000000046");

private static Guid IID_IWebBrowser2 = new Guid("D30C1661-CDAF-11D0-8A3E-00C04FC9E26E");

// Utility for IE cross domain access

// Returns null in case of failure.

public static IHTMLDocument3 GetDocumentFromWindow(IHTMLWindow2 htmlWindow)

{

if (htmlWindow == null)

{

return null;

}

// First try the usual way to get the document.

try

{

IHTMLDocument2 doc = htmlWindow.document;

return (IHTMLDocument3)doc;

}

catch (COMException comEx)

{

// I think COMException won't be ever fired but just to be sure ...

}

catch (UnauthorizedAccessException)

{

}

catch (Exception ex)

{

return null;

}

// At this point the error was E_ACCESSDENIED because the frame contains a document from another domain.

// IE tries to prevent a cross frame scripting security issue.

try

{

// Convert IHTMLWindow2 to IWebBrowser2 using IServiceProvider.

IServiceProvider sp = (IServiceProvider)htmlWindow;

// Use IServiceProvider.QueryService to get IWebBrowser2 object.

Object brws = null;

sp.QueryService(ref IID_IWebBrowserApp, ref IID_IWebBrowser2, out brws);

// Get the document from IWebBrowser2.

IWebBrowser2 browser = (IWebBrowser2)(brws);

return (IHTMLDocument3)browser.Document;

}

catch (Exception ex)

{

Console.WriteLine(ex);

}

return null;

}

}

}

使用的时候方法是这样的:

HTMLDocument doc = (HTMLDocument)Browser.Document.DomDocument;

for (int i = 0; i < Browser.Document.Window.Frames.Count; i++)

{

IHTMLDocument3 baiduDoc = CorssDomainHelper.GetDocumentFromWindow(Browser.Document.Window.Frames[i].DomWindow

as IHTMLWindow2);

if (baiduDoc!=null && baiduDoc.documentElement!=null && baiduDoc.documentElement.document != null)

{

IHTMLElementCollection linkss = ((HTMLDocument)(baiduDoc.documentElement.document)).links;

foreach (mshtml.IHTMLElement element in linkss)

{

//加入你的代码就可以了。

}

}

测试完全可以解决webbrowser 跨域访问iframe的问题。

转发请注明:IT分享  ***

 
 

C#彻底解决Web Browser 跨域读取Iframes内容的更多相关文章

  1. 解决web资源跨域请求问题

    参考地址: http://my.oschina.net/lichaoqiang/blog/317823 在浏览器请求中,出现跨域访问资源的问题,我们肯定会遇到.如果跨域请求被阻止,有可能导致css.j ...

  2. IIS反向代理解决Web前端跨域

    1.1 IIS7反向代理解决跨域问题IIS的版本必须是IIS7及其以上,否则没有反向代理功能:按照以下步骤来配置IIS,以实现反向代理: 1.2 配置步骤1. 下载安装ARR(Application ...

  3. 跨域调用webapi web端跨域调用webapi

    web端跨域调用webapi   在做Web开发中,常常会遇到跨域的问题,到目前为止,已经有非常多的跨域解决方案. 通过自己的研究以及在网上看了一些大神的博客,写了一个Demo 首先新建一个webap ...

  4. 170222、使用Spring Session和Redis解决分布式Session跨域共享问题

    使用Spring Session和Redis解决分布式Session跨域共享问题 原创 2017-02-27 徐刘根 Java后端技术 前言 对于分布式使用Nginx+Tomcat实现负载均衡,最常用 ...

  5. JSON跨域读取那点事(JSONP跨域访问)

    最近在码一个小项目,需要远程读取json.因为需求很少,如果引用jquery使用其getjson方法就显得很浪费嘛= = 这篇文章很详细的解释了JSON跨域读取的前世今生,把原理讲得很透彻.特此分享. ...

  6. 转:解决tomcat服务器跨域问题

    原文地址: 解决tomcat服务器跨域请求问题 注:还未测试 在tomcat 的web.xml 配置文件中加入如下配置过滤器 (如web.xml中有多个filter时要把下面配置放在最前端) < ...

  7. 关于跨域读取json数据我的理解

    这两天在做关于读取json数据的插件,想用getJSON读取数据: $.getJSON(http://www.xxxx.com/Titles.js, function (data) { console ...

  8. Nginx配置解决NetCore的跨域

    使用Nginx配置解决NetCore的跨域 废话不多说,直接上Nginx配置 server { listen 80; server_name 你的Id或域名; location / { add_hea ...

  9. Web Api跨域访问配置及调用示例

    1.Web Api跨域访问配置. 在Web.config中的system.webServer内添加以下代码: <httpProtocol> <customHeaders> &l ...

随机推荐

  1. C---通过指针访问数组

    C语言规定:如果指针变量P已指向数组中的一个元素,则P+1指向同一数组中的下一个元素. 引入指针变量后,就可以用俩种方法来访问数组元素了. 如果p的初值为&a[0],则: P+i 和a+i 就 ...

  2. jQuery实现发送验证码倒计时60秒

    前端HMTL: <div class="form_box"> <div class="line mb40"> <div class ...

  3. 当今最流行的Node.js应用开发框架简介

    快速开发而又容易扩展,高性能且鲁棒性强.Node.js的出现让所有网络应用开发者的这些梦想成为现实.但是,有如其他新的开发语言技术一样,从头开始使用Node.js的最基本功能来编写代码构建应用是一个非 ...

  4. PHP调用Webservice实例

    原文 PHP调用Webservice实例 NuSoap是PHP环境下的WebService编程工具,用于创建或调用WebService.它是一个开源软件,是完全采用PHP语言编写的.通过HTTP收发S ...

  5. CORS(跨域资源共享)跨域问题及解决

    当使用ajax跨域请求时,浏览器报错:XmlHttpRequest error: Origin null is not allowed by Access-Control-Allow-Origin.肯 ...

  6. [译]Java 设计模式之中介者

    (文章翻译自Java Design Pattern: Mediator) 中介者设计模式被用于一组的同事进行协作.这些同事不彼此进行直接的交流联系,但是是通过中介者. 在下面的例子中,A同事想去说话, ...

  7. Android 实现用户列表信息的功能,然后选择删除幻灯片删除功能

    在项目开发过程中.经常须要对用户列表的信息进行删除的操作.Android中经常使用的删除操作方式有两种 .一种就是类似微信的滑动出现删除button方式,另一种是通过CheckBox进行选择.然后通过 ...

  8. asp.net MVC4 +MVCpager

    asp.net MVC4 +MVCpager 无刷新分页 本人菜鸟,最近在用MVC4和MVCpager做无刷新分页时,发现点击下一页时数据不是Ajax提交的,弄了好久终于找到原因,原来还是Jquery ...

  9. 读书笔记—CLR via C#同步构造28-29章节

    前言 这本书这几年零零散散读过两三遍了,作为经典书籍,应该重复读反复读,既然我现在开始写博了,我也准备把以前觉得经典的好书重读细读一遍,并且将笔记整理到博客中,好记性不如烂笔头,同时也在写的过程中也可 ...

  10. 百度Web App在线生成平台Site App体验

    最近收到百度开发者中心邮件,告知之前的百度移动建站服务已经升级为Site App了,Site  App顾名思义是可以创建APP的站点,之前想建立一个APP要么是自己制作,要么是选用国外的在线Web A ...