转载自 :http://blog.csdn.net/gisfarmer/article/details/2836904

  1. using System;
  2. using System.Collections.Generic;
  3. using System.Text;
  4. using System.Net;
  5. using System.IO;
  6. namespace thief
  7. {
  8. class Program
  9. {
  10. static void Main(string[] args)
  11. {
  12. try {
  13. WebClient MyWebClient = new WebClient();
  14. MyWebClient.Credentials = CredentialCache.DefaultCredentials;//获取或设置用于对向Internet资源的请求进行身份验证的网络凭据。
  15. Byte[] pageData = MyWebClient.DownloadData(http://www.163.com); //从指定网站下载数据
  16. string pageHtml = Encoding.Default.GetString(pageData);  //如果获取网站页面采用的是GB2312,则使用这句
  17. //string pageHtml = Encoding.UTF8.GetString(pageData); //如果获取网站页面采用的是UTF-8,则使用这句
  18. Console.WriteLine(pageHtml);//在控制台输入获取的内容
  19. using (StreamWriter sw = new StreamWriter("c://test//ouput.html"))//将获取的内容写入文本
  20. {
  21. sw.Write(pageHtml);
  22. }
  23. Console.ReadLine(); //让控制台暂停,否则一闪而过了
  24. }
  25. catch(WebException webEx) {
  26. Console.WriteLine(webEx.Message.ToString());
  27. }
  28. }
  29. }
  30. }

改进一下,加入定时器后

      1. using System;
      2. using System.Text;
      3. using System.Timers;
      4. using System.Net;
      5. using System.IO;
      6. //<summary>
      7. //每隔5秒钟将指定网页的内容抓取下来,并以文件形式保存到c:/test目录中
      8. //</summary>
      9. namespace TimerTest
      10. {
      11. class Program
      12. {
      13. public static string outFileName = "";                  //生成的文件名
      14. public static string myUrl = "http://bxg.cfchina.cn";    //要抓取的网页
      15. static void Main(string[] args)
      16. {
      17. Timer mytimer = new Timer();
      18. mytimer.Elapsed +=new ElapsedEventHandler(GetUrl);//指定定时器的事件
      19. mytimer.Interval = 5000;//每隔5秒抓一次
      20. mytimer.Start();
      21. mytimer.Enabled = true;
      22. while (Console.Read() != 'q') //直到按小写字母q退出,否则一直抓取下去
      23. {
      24. }
      25. }
      26. //定时器事件内容
      27. static void GetUrl(object source, ElapsedEventArgs e)
      28. {
      29. try
      30. {
      31. WebClient MyWebClient = new WebClient();
      32. MyWebClient.Credentials = CredentialCache.DefaultCredentials;//获取或设置用于对向Internet资源的请求进行身份验证的网络凭据。
      33. Byte[] pageData = MyWebClient.DownloadData(myUrl);//从指定网站下载数据
      34. string pageHtml = Encoding.Default.GetString(pageData);  //如果获取网站页面采用的是GB2312,则使用这句
      35. //string pageHtml = Encoding.UTF8.GetString(pageData); //如果获取网站页面采用的是UTF-8,则使用这句
      36. //Console.WriteLine(pageHtml);//在控制台输入获取的内容
      37. outFileName = "C://test//" + DateTime.Now.ToString().Replace(" ", "").Replace(":", "").Replace("-", "") + ".html";
      38. using (StreamWriter sw = new StreamWriter(outFileName))//将获取的内容写入文本
      39. {
      40. sw.Write(pageHtml);
      41. }
      42. Console.WriteLine(outFileName);  //输出保存后的文件名
      43. }
      44. catch (WebException webEx)
      45. {
      46. Console.WriteLine(webEx.Message.ToString());
      47. }
      48. }
      49. }
      50. }

C#远程获取/读取网页内容的更多相关文章

  1. C#远程获取图片文件流的方法【很通用】

    因为之前写的代码,也能获取到图片流信息,但是会是凌乱的线条,后百度得这个方法,必须记录一下 C# try { WebRequest myrequest = WebRequest.Create(Http ...

  2. Asp.Net使用代理IP远程获取数据

    /// <summary> /// 远程获取数据 /// </summary> /// <param name="url">url</pa ...

  3. windows和linux下如何远程获取操作系统版本和主机名

    远程获取windows和linux操作系统版本和主机名需要具备以下条件: 假设 主机A(windows 7),ip:192.168.12.2 主机B(centos 6.3),ip:192.168.12 ...

  4. Vue实现远程获取路由与页面刷新导致404错误的解决

    一.背景 先简单介绍一下现在项目情况:前后端分离,后端服务是Java写的,前端是Vue+ElementUI. 最近的一个需求是:通过后端Api去获取前端路由表,原因是每个登录角色对应的前端路由表可能是 ...

  5. JS远程获取网页源代码的例子

    js代码获取网页源代码. 代码: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> < ...

  6. C#通过属性名称获取(读取)属性值的方法

    之前在开发一个程序,希望能够通过属性名称读取出属性值,但是由于那时候不熟悉反射,所以并没有找到合适的方法,做了不少的重复性工作啊! 然后今天我再上网找了找,被我找到了,跟大家分享一下. 其实原理并不复 ...

  7. Xamarin.Android 调用Web Api(通过ListView展示远程获取的数据)

    xamarin.android如何调用sqlserver 数据库呢(或者其他的),很多新手都会有这个疑问.xamarin.android调用远程数据主要有两种方式: 在Android中保存数据或调用数 ...

  8. php远程获取图片或文件信息(get_headers,fsocketopen,curl)

    <?php if(!function_exists("remote_filesize")){ /** * 获取远程或本地文件信息 * @param string $strUr ...

  9. 基于HttpClient、Jsoup的爬虫获取指定网页内容

    不断尝试,发现越来越多有趣的东西,刚刚接触Jsoup感觉比正则表达式用起来方便,但也有局限只适用HTML的解析. 不能尝试运用到四则运算中(工作室刚开始联系的小程序). 在原来写的HttpClient ...

随机推荐

  1. div滚动条,可以自由的给滚动条定义背景,上下按钮,当然不仅仅是颜色,连图片当背景也可以。

    可以自由的给滚动条定义背景,上下按钮,当然不仅仅是颜色,连图片当背景也可以.支持鼠标滚轮,点击滚动条滚轴定位,上下按钮久按加速,兼容firefox,谷歌 下载地址

  2. HTML&CSS基础学习笔记1.7-高亮文本及组合使用

    HTML提供了<mark>标签可以让你的文本高亮,这样看起来更加醒目.<mark>标签内的文本会呈现特殊的样式,它和<em>,<strong>一样也是一 ...

  3. pyqt5和qt-designer结合

    在ubuntu中我们安装了python3-pyqt5这个包后就可以用pyqt5编程了,但是只能用纯代码写窗体,很麻烦.我们要用qt-designer来设计窗体. 我们通过新立得安装qt4-design ...

  4. Repeater中添加按钮,点击按钮获取某一行的数据

    1.添加编辑按钮和删除按钮 <asp:Repeater ID="Repeater1" runat="server" onitemcommand=" ...

  5. MTKdroidToolsV2.53 MTK安卓提取线刷资料的工具 使用教程

    备份的时候需插入1G以上内存卡,并确保机器电量充足. 机器需要root才能备份. 最新版本 支持大部分机型 一键root

  6. 来,试试PERL

    试试,看看能否真的替代AWK,SED这些的... #!/usr/bin/perl print "hello, world!\n"; $line = <STDIN>; i ...

  7. KEIL UV3中光标不对齐解决

    Keil uVision3与uV2相比增加了对更多型号单片机的支持,另外还对一些的方面进行了优化.不过它却优化出一个让人头疼的问题,那就是光标位置显示不正确!这一问题给程序的编写带来了许多不便.不过不 ...

  8. spring注解方式 idea报could not autowire,eclipse却没有问题

    解决办法1: 从根本上解决: File-Project Structure 页面 Facets下删掉 Spring(直接右键Delete) 这个解答是对的.并不会降低安全性!!因为创建项目的时候,都是 ...

  9. BOT、BT、PPP形式介绍(1)

    BOT.BT.PPP形式介绍 BOT1.什么是BOT     BOT是英文Build-Operate-Transfer的缩写,即“建设-经营-转让”.实质上是基础设施投资.建设和经营的一种方式,以政府 ...

  10. Maven--生命周期和插件(四)

    <Maven--搭建开发环境(一)> <Maven--构建企业级仓库(二)> <Maven—几个需要补充的问题(三)> <Maven—生命周期和插件(四)&g ...