c# 网站生成静态页面
在一些需要经常更新页面数据的网站中,一般访问量不是很大的都直接发布的是带后台代码,每次访问都是有数据库交互的。但是一旦访问量增加了,那么这些服务器开销变成本就要考虑进来了,像一些文章,后台编辑后,文章内容存入数据库,如果1000人访问,如果还是每次取数据库,那这1000次的io访问就显得比较大了,一个好的方法就是,文章确定之后,做成静态页面,而这个做的方法由程序来做,就是递归遍历整个网站,将网站内容都访问一遍,然后生成这些页面的静态文本页面,在将这些页面发布,这样对浏览者而言,他看到的还是同一个地址,同一份文章,只是这份是静态的而言。这样就提升了网站的效率节约了资源;
下面附上一份C#遍历网站内容,然后生成内容页面代码;
- private ArrayList htmlCreatedList = new ArrayList();
- /// <summary>
- /// 递归实现页面静态化功能
- /// </summary>
- /// <param name="urlString">要访问的页面链接地址</param>
- public void SaveHtmlCode(string urlString)
- {
- if (htmlCreatedList.Contains(urlString))
- {
- return;
- }
- string htmlCode = GetHtmlCodeFromUrl(urlString);
- string htmlPath = urlString.ToPhysicalPath();
- string direcHtmlPath = Path.GetDirectoryName(htmlPath);
- if (!Directory.Exists(direcHtmlPath))
- {
- Directory.CreateDirectory(direcHtmlPath);
- }
- File.WriteAllText(htmlPath, htmlCode);
- htmlCreatedList.Add(urlString);
- var urlList = GetUrlLinkFromHtmlCode(htmlCode);
- string urlTemp = string.Empty;
- foreach (string url in urlList)
- {
- urlTemp = url;
- urlTemp = Regex.Replace(urlTemp, "href\\s*=\\s*", "");
- urlTemp = urlTemp.Replace("\"", "");
- urlTemp = urlTemp.Replace("\\", "/");
- urlTemp = WebConfigInfo.UrlPrefix + urlTemp;
- SaveHtmlCode(urlTemp);
- }
- }
- /// <summary>
- /// 通过HttpWebRequest页面链接的html代码
- /// </summary>
- /// <param name="urlString">页面链接地址</param>
- /// <returns>页面链接对应的html代码</returns>
- private string GetHtmlCodeFromUrl(string urlString)
- {
- HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);
- hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
- hwRequest.Accept = "*/*";
- hwRequest.KeepAlive = true;
- hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
- HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();
- Stream streamResponse = hwResponse.GetResponseStream();
- StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));
- string strHtml = readerOfStream.ReadToEnd();
- readerOfStream.Close();
- streamResponse.Close();
- hwResponse.Close();
- return strHtml;
- }
- ///<summary>
- ///正则表达式匹配出html代码中的超链接
- ///</summary>
- ///<param name="htmlCode">要找出超链接的html代码</param>
- ///<returns></returns>
- private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)
- {
- string strRegex = "href\\s*=\\s*(?:[\"'](?<1>[^\"'.#:]*)[\"'])";
- Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
- MatchCollection ms = r.Matches(htmlCode);
- IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");
- return listUrl.Distinct();
- }
- }
给string 扩展了一个方法。
- public static string ToPhysicalPath(this string urlString)
- {
- System.Uri uri = new System.Uri(urlString);
- string htmlPath = string.Format("{0}\\Html\\{1}\\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);
- string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);
- htmlPath += string.Join(string.Empty, querys);
- htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";
- htmlPath = htmlPath.Replace("/", "\\");
- htmlPath = htmlPath.Replace("\\\\", "\\");
- return htmlPath;
- }
c# 网站生成静态页面的更多相关文章
- 浅谈php生成静态页面
一.引 言 在速度上,静态页面要比动态页面的比方php快很多,这是毫无疑问的,但是由于静态页面的灵活性较差,如果不借助数据库或其他的设备保存相关信息的话,整体的管理上比较繁琐,比方修改编辑.比方阅读权 ...
- .net 生成 静态页面
.net 生成 静态页面 <!--Main.Aspx--> <%@ page language="C#" %> <%@ import namespac ...
- C#根据网址生成静态页面
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件 是后台管理的首页. 包含生成留言板首页,以及显示用户名,退出等功能. 根据网址生成页面的方法: boo ...
- 比较详细PHP生成静态页面教程
一,PHP脚本与动态页面. PHP脚本是一种服务器端脚本程序,可通过嵌入等方法与HTML文件混合, 也可以类,函数封装等形式,以模板的方式对用户请求进行处理.无论以何种方式,它的基本原理是这样的.由客 ...
- [转]把动态页面.aspx 生成静态页面.html
本文转自:http://blog.csdn.net/csb5201314/article/details/5391688 如果要把主页Index.aspx 生成静态页面 Index.html后输出会提 ...
- PHP生成静态页面的方法
在PHP网站开发中为了网站推广和SEO等需要,需要对网站进行全站或局部静态化处理,PHP生成静态HTML页面有多种方法,比如利用PHP模板.缓存 等实现页面静态化,今天就以PHP实例教程形 ...
- .NET生成静态页面例子
主要做法如下: 1.创建网站,并创建一个模板页,template.htm 2.添加一个web窗体Default.aspx 3.在网站下新建文件夹htm,设置该文件夹的属性,确保该文件夹具有可写权限 详 ...
- 三种C#.net生成静态页面的方法
ASP.NET生成静态页面方法主要有三种 第一种方法:向服务器的动态页面发送请求,获取页面的html代码.这种方法缺点显而易见:速度慢.另外如果请求的动态页面有验证控件的话,返回的html页面却无 ...
- Java项目生成静态页面
第一次做项目需要生成静态页面,网上很多大牛对将网页生成静态页面有很多异议.说一下我的看法. 不外乎有以下因素: 1.从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种 ...
随机推荐
- vijos p1729 Knights
描述 在一个N*N的正方形棋盘上,放置了一些骑士.我们将棋盘的行用1开始的N个自然数标记,将列用'A'开始的N个大写英文字母标记.举个例子来说,一个标准的8*8的国际象棋棋盘的行标记为1..8,列标记 ...
- 【BZOJ】【1006】【HNOI2008】神奇的国度
弦图最小染色/MCS算法 Orz PoPoQQQ (UPD:ydc的写法好像更熟悉一些……(类似堆优化的Dij啊~ 先留个坑……明天再看一看……感觉好神奇>_<(完美消除序列之于弦图 就 ...
- OTL翻译(5) -- otl_stream流相关绑定变量
声明绑定变量 本章节将详细的说明如何在otl_stream流里面声明绑定变量. SQL语句.SQL语句块或存储过程在程序里面使用的时候总是带有占位符.OTL里面带有一个小的解析器用来解析这些占位符,并 ...
- 【c语言】使用gumbo解析HTML
之前使用过PHP的Simple HTML DOM简单地解析HTML但PHP终非我所熟悉的语言,虽然我并不对语言抱有绝对的执着= =(什么你不相信,好吧,不管你信不信,反正我是信了= =).虽然可以简单 ...
- Python源码学习七 .py文件的解释
Python源码太复杂了... 今天看了下对.py文件的parse, 云里雾里的 py文件是最简单的, 在python的交互式窗口 import这个模块 a = 10 print(a) 开始分析,堆栈 ...
- 细聊MySQL的分区功能
此篇主要介绍下MySQL的分区功能.我们分别从分区的概念.分区对于MySQL应用的优点.分区的类别及设置来和大家一起探讨下MySQL的分区. 什么是分区? MySQL在未启用分区功能时,数据库的单个表 ...
- Anagrams leetcode java
题目: Given an array of strings, return all groups of strings that are anagrams. Note: All inputs will ...
- CentOS上编译安装OpenCV-2.3.1与ffmpeg-2.1.2
已測试环境: CentOS 6.3 32bit CentOS 6.5 64bit 以前在CentOS 6.3 32bit安装过OpenCV,參见CentOS 6.3中安装OpenCV2.3.1,现在换 ...
- Android应用开发学习笔记之Fragment
作者:刘昊昱 博客:http://blog.csdn.net/liuhaoyutz Fragment翻译成中文就是“碎片”.“片断”的意思,Fragment通常用来作为一个Activity用户界面的一 ...
- C++和.net的集合类对应
Here's what I've found (ignoring the old non-generic collections): Array - C array, though the .NE ...