现在,在不少应用场合中都希望做到数据抓取,特别是基于网页部分的抓取.其实网页抓取的过程实际上是通过编程的方法,去抓取不同网站网页后,再进行 分析筛选的过程.比如,有的比较购物网站,会同时去抓取不同购物网站的数据并将其保存在数据库中.一般,这些网页的抓取都需要对抓取回来的HTML进行解 析. .NET提供了很多类去访问并获得远程网页的数据,比如WebClient类和HttpWebRequest类.这些类对于利用HTTP去访问远端 的网页并且下载下来是很有用的,但在对于所下载下来的HTML的解析能力