上一篇提到采用IHttpModule来实现当用户访问网站的时候,通过重新定义Response.Filter来实现将返回给客户端的html代码保存,以便用户下一次访问是直接访问静态页面。

Asp.Net MVC页面静态化功能实现一:利用IHttpModule,摒弃ResultFilter

后来想到可以通过WebRequest获取html代码,然后采用递归算法来实现。基本实现思路如下:

通过WebRequest获取超链接地址返回的html代码,并保存;然后正则表达式匹配html代码中所有的超链接href=""里面地址信息; 循坏超链接地址,然后再递归WebRequest获取html代码

实现代码如下:

public class HtmlPageHelper
{
private ArrayList htmlCreatedList = new ArrayList(); /// <summary>
/// 递归实现页面静态化功能
/// </summary>
/// <param name="urlString">要访问的页面链接地址</param>
public void SaveHtmlCode(string urlString)
{
if (htmlCreatedList.Contains(urlString))
{
return;
}
string htmlCode = GetHtmlCodeFromUrl(urlString);
string htmlPath = GetHtmlPathFromUrl(urlString);
string direcHtmlPath = Path.GetDirectoryName(htmlPath);
if (!Directory.Exists(direcHtmlPath))
{
Directory.CreateDirectory(direcHtmlPath);
}
File.WriteAllText(htmlPath, htmlCode);
htmlCreatedList.Add(urlString); ArrayList urlList = GetUrlLinkFromHtmlCode(htmlCode);
string urlTemp = string.Empty;
foreach (string url in urlList)
{
urlTemp = url;
urlTemp = Regex.Replace(urlTemp, "href\\s*=\\s*", "");
urlTemp = urlTemp.Replace("\"", "");
urlTemp = urlTemp.Replace("\\", "/");
urlTemp = WebConfigInfo.UrlPrefix + urlTemp;
SaveHtmlCode(urlTemp);
}
} /// <summary>
/// 通过HttpWebRequest页面链接的html代码
/// </summary>
/// <param name="urlString">页面链接地址</param>
/// <returns>页面链接对应的html代码</returns>
private string GetHtmlCodeFromUrl(string urlString)
{
HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);
hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
hwRequest.Accept = "*/*";
hwRequest.KeepAlive = true;
hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();
Stream streamResponse = hwResponse.GetResponseStream();
StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));
string strHtml = readerOfStream.ReadToEnd();
readerOfStream.Close();
streamResponse.Close();
hwResponse.Close();
return strHtml;
} /// <summary>
/// 分析页面链接地址,生成静态页面保存的物理路径
/// </summary>
/// <param name="urlString">页面链接地址</param>
/// <returns>静态页面保存的物理路径</returns>
private string GetHtmlPathFromUrl(string urlString)
{
Uri uri = new Uri(urlString);
string filePath = HttpContext.Current.Request.PhysicalApplicationPath + "Html" + uri.AbsolutePath + "\\";
string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);
foreach (string query in querys)
{
filePath += query;
}
filePath += querys.Length.Equals() ? "Index.html" : ".html";
filePath = filePath.Replace("/", "\\");
filePath = filePath.Replace("\\\\", "\\");
return filePath;
} /// <summary>
/// 正则表达式匹配出html代码中的超链接
/// </summary>
/// <param name="htmlCode">要找出超链接的html代码</param>
/// <returns></returns>
private ArrayList GetUrlLinkFromHtmlCode(string htmlCode)
{
ArrayList aList = new ArrayList();
string strRegex = "href\\s*=\\s*(?:[\"'](?<1>[^\"'.#:]*)[\"'])";
Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
MatchCollection m = r.Matches(htmlCode);
for (int i = ; i <= m.Count - ; i++)
{
string strNew = m[i].ToString().Replace("amp;", "");
if (!aList.Contains(strNew))
{
aList.Add(strNew);
}
}
return aList;
}
}

Asp.Net MVC页面静态化功能实现二:用递归算法来实现的更多相关文章

  1. Asp.Net MVC页面静态化功能实现一:利用IHttpModule,摒弃ResultFilter

    上一篇有提到利用IHttpModule和ResultFilter实现页面静态化功能.后来经过一些改动,将ResultFilter中要实现的功能全部转移到IHttpModule中来实现 Asp.Net ...

  2. Asp.Net MVC页面静态化功能实现一:利用IHttpModule和ResultFilter

    由于公司现在所采用的是一套CMS内容管理系统的框架,所以最近项目中有一个需求提到要求实现页面静态化的功能.在网上查询了一些资料和文献,最后采用的是小尾鱼的池塘提供的 利用ResultFilter实现a ...

  3. ASP.NET MVC 页面静态化操作的思路

    本文主要讲述了在asp.net mvc中,页面静态化的几种思路和方法.对于网站来说,生成纯html静态页面除了有利于seo外,还可以减轻网站的负载能力和提高网站性能.在asp.net mvc中,视图的 ...

  4. 利用ResultFilter实现asp.net mvc 页面静态化

    为了提高网站性能.和网站的负载能力,页面静态化是一种有效的方式,这里对于asp.net mvc3 构架下的网站,提供一种个人认为比较好的静态话方式. 实现原理是通过mvc提供的过滤器扩展点实现页面内容 ...

  5. Asp.net Mvc 页面静态化

    http://www.cnblogs.com/gowhy/archive/2013/01/01/2841472.html

  6. Asp.net动态页面静态化之初始NVelocity模板引擎

    Asp.net动态页面静态化之初始NVelocity模板引擎 静态页面是网页的代码都在页面中,不须要运行asp,php,jsp,.net等程序生成client网页代码的网页,静态页面网址中一般不含&q ...

  7. MVC页面静态化

    MVC 页面静态化   最近工作需要,实现页面静态化,以前在ASP时代,都是FSO自己手动生成的. 新时代,MVC了,当然也要新技术,网上一搜,找到一种解决方案,是基于MVC3的,实现原理是通过mvc ...

  8. MVC 页面静态化

    最近工作需要,实现页面静态化,以前在ASP时代,都是FSO自己手动生成的. 新时代,MVC了,当然也要新技术,网上一搜,找到一种解决方案,是基于MVC3的,实现原理是通过mvc提供的过滤器扩展点实现页 ...

  9. 利用ResultFilter实现asp.net mvc3 页面静态化

    为了提高网站性能.和网站的负载能力,页面静态化是一种有效的方式,这里对于asp.net mvc3 构架下的网站,提供一种个人认为比较好的静态话方式. 实现原理是通过mvc提供的过滤器扩展点实现页面内容 ...

随机推荐

  1. Android使用SVG矢量创建很酷的动态效率!

    尊重原创,欢迎转载.转载请注明: FROM  GA_studio   http://blog.csdn.net/tianjian4592 一个真正酷炫的动效往往让人虎躯一震,话不多说.咱们先瞅瞅效果: ...

  2. 博客搬到了http://xianglong.me

    自己用Django建立个人博客.这个博客的部分已经迁移到新的个人博客. 博客地址:龙 (http://xianglong.me),欢迎. 版权声明:本文博客原创文章,博客,未经同意,不得转载.

  3. 苹果(APPLE)开发人员账号说明及注冊流程(99美元公司版/个人版及299美元企业版)

    APPLE的政策是,要公布到APP STORE必须用99美元的个人版或公司版Apple Developer Programs,要在非商店外下载仅仅能使用299美元的企业版iOS Developer E ...

  4. CI框架学习笔记

    打印SQL语句$this->dbRead->last_query(); 重映射方法正如上文所说,URI 的第二段通常决定控制器的哪个方法被调用.CodeIgniter 允许你使用 _rem ...

  5. JNLP(Java Web Start )(转)

    JNLP(Java Network Launching Protocol )是java提供的一种可以通过浏览器直接执行java应用程序的途径,它使你可以直接通过一个网页上的url连接打开一个java应 ...

  6. HDU Today (图论)

    经过锦囊相助,海东集团终于度过了危机,从此,HDU的发展就一直顺风顺水,到了2050年,集团已经相当规模了,据说进入了钱江肉丝经济开发区500强.这时候,XHD夫妇也退居了二线,并在风景秀美的诸暨市浬 ...

  7. 分析RAC下一个SPFILE整合的三篇文章的文件更改

    大约RAC下一个spfile分析_整理在_2014.4.17 说明:文章来源于网络 第一篇:RAC下SPFILE文件改动 在RAC下spfile位置的改动与单节点环境不全然一致,有些地方须要特别注意, ...

  8. LINUX2.4.x网络安全框架

       在分析LINUX2.4.x网络安全的实现之前先简介一下它里面包括的几个重要概念:netfilter.iptables.match.target.nf_sockopt_ops.网络安全功能点的实现 ...

  9. jQuery中的.height()、.innerHeight()和.outerHeight()

    jQuery中的.height()..innerHeight()和.outerHeight()和W3C的盒模型相关的几个获取元素尺寸的方法.对应的宽度获取方法分别为.width()..innerWid ...

  10. 为代码减负之&lt;一&gt;触发器(SQL)

    对触发器一词早有耳闻(最早是在耿大妈的数据库视频中),当初看完视频后,对理解不深刻的东西如:触发器,存储过程,事务,日志等等没有具体的去查阅,也没有具体的去尝试,应用.所以才导致了今天的博客(把曾经丢 ...