在一些需要经常更新页面数据的网站中,一般访问量不是很大的都直接发布的是带后台代码,每次访问都是有数据库交互的。但是一旦访问量增加了,那么这些服务器开销变成本就要考虑进来了,像一些文章,后台编辑后,文章内容存入数据库,如果1000人访问,如果还是每次取数据库,那这1000次的io访问就显得比较大了,一个好的方法就是,文章确定之后,做成静态页面,而这个做的方法由程序来做,就是递归遍历整个网站,将网站内容都访问一遍,然后生成这些页面的静态文本页面,在将这些页面发布,这样对浏览者而言,他看到的还是同一个地址,同一份文章,只是这份是静态的而言。这样就提升了网站的效率节约了资源;

下面附上一份C#遍历网站内容,然后生成内容页面代码;

  1. private ArrayList htmlCreatedList = new ArrayList();
  2. /// <summary>
  3. /// 递归实现页面静态化功能
  4. /// </summary>
  5. /// <param name="urlString">要访问的页面链接地址</param>
  6. public void SaveHtmlCode(string urlString)
  7. {
  8. if (htmlCreatedList.Contains(urlString))
  9. {
  10. return;
  11. }
  12. string htmlCode = GetHtmlCodeFromUrl(urlString);
  13. string htmlPath = urlString.ToPhysicalPath();
  14. string direcHtmlPath = Path.GetDirectoryName(htmlPath);
  15. if (!Directory.Exists(direcHtmlPath))
  16. {
  17. Directory.CreateDirectory(direcHtmlPath);
  18. }
  19. File.WriteAllText(htmlPath, htmlCode);
  20. htmlCreatedList.Add(urlString);
  21. var urlList = GetUrlLinkFromHtmlCode(htmlCode);
  22. string urlTemp = string.Empty;
  23. foreach (string url in urlList)
  24. {
  25. urlTemp = url;
  26. urlTemp = Regex.Replace(urlTemp, "href\\s*=\\s*", "");
  27. urlTemp = urlTemp.Replace("\"", "");
  28. urlTemp = urlTemp.Replace("\\", "/");
  29. urlTemp = WebConfigInfo.UrlPrefix + urlTemp;
  30. SaveHtmlCode(urlTemp);
  31. }
  32. }
  33. /// <summary>
  34. /// 通过HttpWebRequest页面链接的html代码
  35. /// </summary>
  36. /// <param name="urlString">页面链接地址</param>
  37. /// <returns>页面链接对应的html代码</returns>
  38. private string GetHtmlCodeFromUrl(string urlString)
  39. {
  40. HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);
  41. hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
  42. hwRequest.Accept = "*/*";
  43. hwRequest.KeepAlive = true;
  44. hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
  45. HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();
  46. Stream streamResponse = hwResponse.GetResponseStream();
  47. StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));
  48. string strHtml = readerOfStream.ReadToEnd();
  49. readerOfStream.Close();
  50. streamResponse.Close();
  51. hwResponse.Close();
  52. return strHtml;
  53. }
  54. ///<summary>
  55. ///正则表达式匹配出html代码中的超链接
  56. ///</summary>
  57. ///<param name="htmlCode">要找出超链接的html代码</param>
  58. ///<returns></returns>
  59. private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)
  60. {
  61. string strRegex = "href\\s*=\\s*(?:[\"'](?<1>[^\"'.#:]*)[\"'])";
  62. Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
  63. MatchCollection ms = r.Matches(htmlCode);
  64. IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");
  65. return listUrl.Distinct();
  66. }
  67. }

给string 扩展了一个方法。

    1. public static string ToPhysicalPath(this string urlString)
    2. {
    3. System.Uri uri = new System.Uri(urlString);
    4. string htmlPath = string.Format("{0}\\Html\\{1}\\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);
    5. string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);
    6. htmlPath += string.Join(string.Empty, querys);
    7. htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";
    8. htmlPath = htmlPath.Replace("/", "\\");
    9. htmlPath = htmlPath.Replace("\\\\", "\\");
    10. return htmlPath;
    11. }

c# 网站生成静态页面的更多相关文章

  1. 浅谈php生成静态页面

    一.引 言 在速度上,静态页面要比动态页面的比方php快很多,这是毫无疑问的,但是由于静态页面的灵活性较差,如果不借助数据库或其他的设备保存相关信息的话,整体的管理上比较繁琐,比方修改编辑.比方阅读权 ...

  2. .net 生成 静态页面

    .net 生成 静态页面 <!--Main.Aspx--> <%@ page language="C#" %> <%@ import namespac ...

  3. C#根据网址生成静态页面

    HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件 是后台管理的首页. 包含生成留言板首页,以及显示用户名,退出等功能. 根据网址生成页面的方法: boo ...

  4. 比较详细PHP生成静态页面教程

    一,PHP脚本与动态页面. PHP脚本是一种服务器端脚本程序,可通过嵌入等方法与HTML文件混合, 也可以类,函数封装等形式,以模板的方式对用户请求进行处理.无论以何种方式,它的基本原理是这样的.由客 ...

  5. [转]把动态页面.aspx 生成静态页面.html

    本文转自:http://blog.csdn.net/csb5201314/article/details/5391688 如果要把主页Index.aspx 生成静态页面 Index.html后输出会提 ...

  6. PHP生成静态页面的方法

          在PHP网站开发中为了网站推广和SEO等需要,需要对网站进行全站或局部静态化处理,PHP生成静态HTML页面有多种方法,比如利用PHP模板.缓存 等实现页面静态化,今天就以PHP实例教程形 ...

  7. .NET生成静态页面例子

    主要做法如下: 1.创建网站,并创建一个模板页,template.htm 2.添加一个web窗体Default.aspx 3.在网站下新建文件夹htm,设置该文件夹的属性,确保该文件夹具有可写权限 详 ...

  8. 三种C#.net生成静态页面的方法

    ASP.NET生成静态页面方法主要有三种   第一种方法:向服务器的动态页面发送请求,获取页面的html代码.这种方法缺点显而易见:速度慢.另外如果请求的动态页面有验证控件的话,返回的html页面却无 ...

  9. Java项目生成静态页面

    第一次做项目需要生成静态页面,网上很多大牛对将网页生成静态页面有很多异议.说一下我的看法. 不外乎有以下因素: 1.从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种 ...

随机推荐

  1. OpenCV学习(40) 人脸识别(4)

    在人脸识别模式类中,还实现了一种基于LBP直方图的人脸识别方法.LBP图的原理参照:http://www.cnblogs.com/mikewolf2002/p/3438698.html       在 ...

  2. go语言之进阶篇同名字段

    1.同名字段 示例: package main import "fmt" type Person struct { name string //名字 sex byte //性别, ...

  3. 页面的缓存设置与meta的作用详细解释

    网上转的,来自JSP的,但是原理大同小异哦,有时间 写个asp.net版的 HTML的HTTP协议头信息中控制着页面在几个地方的缓存信息,包括浏览器端,中间缓存服务器端(如:squid等),Web服务 ...

  4. [Ajax] AJAX初体验之-在博客中添加无刷新搜索

    现在博客很流行,相信应该上网时间稍微长点的朋友都会在这或者在那的有一个自己的博客.对于一些有一定能力的朋友,可能更喜欢自己去下载一个博客程序来架设一个自己的博客,而不是使用一些博客网站提供的服务.而大 ...

  5. C语言学习笔记:14_内部函数和外部函数

    /* * 14_内部函数和外部函数.c * * Created on: 2015年7月5日 * Author: zhong */ #include <stdio.h> #include & ...

  6. Web前端开发资源集锦

    前端开发已经成为当前炙手可热的技术之一.本周我们除了给大家带技术相关资讯,还有一些技术人员常用的网站.希望大家不要错过我们本周的内容.原文来自:极客标签 为神马说写程序是很艰难的 程序员 做一名优秀程 ...

  7. Hibernate常用查询语句

    Hibernate常用查询语句 Hib的检索方式1'导航对象图检索方式.通过已经加载的对象,调用.iterator()方法可以得到order对象如果是首次执行此方法,Hib会从数据库加载关联的orde ...

  8. VarPtr 得到地址 指针

    在Basic语言演变成QBasic,然后到Visual Basic之前,VarPtr函数就已经存在了.开始,这个函数存在于VB运行库1.0版中.通过声明可以调用这个函数: Declare Functi ...

  9. mac安装热更新插件

    查看.修改或者执行某些命令需要root用户的权限,如果不想直接切换到root用户,就可以使用sudo命令.sudo命令用于针对单个命令授予临时权限.sudo仅在需要时授予用户权限,减少了用户因为错误执 ...

  10. vue inheritAttrs、$attrs和$listeners使用

    inheritAttrs.$attrs和$listeners使用场景: 组件传值,尤其是祖孙组件有跨度的传值. (1)inheritAttrs 属性说明:https://cn.vuejs.org/v2 ...