1、htmlCheck类

using System;
using System.Collections.Generic;
using System.Text;
using System.Collections;
using System.Diagnostics;
namespace htmlCheck
{
/// <summary>
/// Asp.Net检查HTML是否闭合以及自动修复 http://webapi.cnblogs.com/
/// </summary>
class TagsList
{
private ArrayList data; public int Size
{
get
{
return data.Count;
}
} public TagsList()
{
data = new ArrayList();
} public void add(String str)
{
data.Add(str);
} public string get(int index)
{
if (index < data.Count)
return (string)data[index];
else
return null;
} public bool remove(string str)
{
if (data.IndexOf(str) == -) return false;
data.Remove(str);
return true;
} public void remove(int index)
{
data.RemoveAt(index);
}
} public class TagsChecker
{
/// <summary>
/// 检查html标签是闭合
/// </summary>
/// <param name="str"></param>
/// <returns></returns>
public static bool check(string str)
{
TagsList[] unclosedTags = getUnclosedTags(str); if (unclosedTags[].Size != )
{
return false;
}
for (int i = ; i < unclosedTags[].Size; i++)
{
if (unclosedTags[].get(i) != null)
return false;
} return true;
}
/// <summary>
/// 处理未闭合的html代码
/// </summary>
/// <param name="str"></param>
/// <returns></returns>
public static string fix(String str)
{
StringBuilder fixeds = new StringBuilder(); // 存放修复后的字符串
TagsList[] unclosedTags = getUnclosedTags(str); // 生成新字符串
for (int i = unclosedTags[].Size - ; i > -; i--)
{
fixeds.Append("<" + unclosedTags[].get(i) + ">");
} fixeds.Append(str); for (int i = unclosedTags[].Size - ; i > -; i--)
{
String s = null;
if ((s = unclosedTags[].get(i)) != null)
{
fixeds.Append("</" + s + ">");
}
} return fixeds.ToString();
} private static TagsList[] getUnclosedTags(String str)
{
StringBuilder temp = new StringBuilder(); // 存放标签
TagsList[] unclosedTags = new TagsList[];
unclosedTags[] = new TagsList(); // 前不闭合,如有</div>而前面没有<div>
unclosedTags[] = new TagsList(); // 后不闭合,如有<div>而后面没有</div>
bool flag = false; // 记录双引号"或单引号'
char currentJump = ' '; // 记录需要跳过''还是"" char current = ' ', last = ' '; // 当前 & 上一个 // 开始判断
for (int i = ; i < str.Length; )
{
current = str[i++]; // 读取一个字符
if (current == '"' || current == '\'')
{
flag = flag ? false : true; // 若为引号,flag翻转
currentJump = current;
if (flag)
{
while (i < str.Length && str[i++] != currentJump)
; // 跳过引号之间的部分
flag = false;
}
}
else if (current == '<')
{ // 开始提取标签
current = str[i++];
if (current == '/')
{ // 标签的闭合部分,如</div>
current = str[i++]; // 读取标签
while (i < str.Length && current != '>')
{
temp.Append(current);
current = str[i++];
} // 从tags_bottom移除一个闭合的标签
if (!unclosedTags[].remove(temp.ToString()))
{ // 若移除失败,说明前面没有需要闭合的标签
unclosedTags[].add(temp.ToString()); // 此标签需要前闭合
}
temp.Remove(, temp.Length); // 清空temp
}
else
{ // 标签的前部分,如<div>
last = current;
while (i < str.Length && current != ' '
&& current != ' ' && current != '>')
{
temp.Append(current);
last = current;
current = str[i++];
} // 已经读取到标签,跳过其他内容,如<div id=test>跳过id=test
while (i < str.Length && current != '>')
{
last = current;
current = str[i++];
if (current == '"' || current == '\'')
{ // 判断双引号
flag = flag ? false : true;
currentJump = current;
if (flag)
{ // 若引号不闭合,跳过到下一个引号之间的内容
while (i < str.Length && str[i++] != currentJump)
;
current = str[i++];
flag = false;
}
}
}
if (last != '/' && current == '>') // 判断这种类型:<TagName />
unclosedTags[].add(temp.ToString());
temp.Remove(, temp.Length);
}
}
}
return unclosedTags;
}
}
}

2、使用方法

using System;
using System.Collections.Generic;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using htmlCheck;//注意,添加这个引用
using System.Text.RegularExpressions; public partial class ceshi : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
string str1 = "<p>tt<table><tr><td>webapi</td></tr><tr><td>323</td></p>";
string str2 = "tt<u>ss</u><div id=test name=\"<test>\"><a>fds</a></div>";
Response.Write("\r\n检查文本 " + str1);
Response.Write("\r\n结果:" + TagsChecker.check(str1));
Response.Write("\r\n检查文本 " + str2);
Response.Write("\r\n结果:" + TagsChecker.check(str2));
Response.Write("\r\n修复文本 " + str1);
Response.Write("\r\n结果:" + TagsChecker.fix(str1)); }
}

说明:转载的,已测试,确实闭合修复了,但是闭合的位置不正确

Asp.Net检查HTML是否闭合以及自动修复的更多相关文章

  1. asp.net 检查文件夹和文件是否存在

    原文  asp.net 检查文件夹和文件是否存在 允许 path 参数指定相对或绝对路径信息. 相对路径信息被解释为相对于当前工作目录. 检查该目录是否存在之前,从 path 参数的末尾移除尾随空格. ...

  2. asp.net检查验证字符串是否为纯数字方法小结

    原文  asp.net检查验证字符串是否为纯数字方法小结 在asp.net中验证字符串是不是为数字我们没有像php中那么多丰富的函数来直接使用,这里我整理了一些比较实例的验证字符串是否为纯数字方法代码 ...

  3. asp.net检查服务器上目录或文件是否存在示例

    原文 asp.net检查服务器上目录或文件是否存在示例 asp.net为我们提供了文件系统对象了,对于目录与文件判断是否存在我们有System.IO.File.Exists与System.IO.Dir ...

  4. asp.net C#检查URL是否有效

    我们有时候需要对用户输入的网站(URL)进行有效性检查,  代码如下 复制代码 function CheckUrl(str) {    var RegUrl = new RegExp();    Re ...

  5. ASP.NET(转自wiki)

    ASP.NET是由微软在.NET Framework框架中所提供,开发Web应用程序的类库,封装在System.Web.dll文件中,显露出System.Web名字空间,并提供ASP.NET网页处理. ...

  6. .net学习笔记----Asp.net的生命周期之一应用程序生命周期

    Http请求刚刚到达服务器的时候 当服务器接收到一个 Http请求的时候,IIS (Internet Information Services,互联网信息服务)首先需要决定如何去处理这个请求. 什么是 ...

  7. ASP连接access 数据库的增删改查 - imsoft.cnblogs

    假设数据库文件名叫data.mdb里面有2个表:1.admin2.news假设admin是保存用户名和密码,里面有字段:UserName,PassWord.假设我们要在判断一个用户名叫name,密码是 ...

  8. ASP.NET 应用程序生命周期概述[转自MSDN]

    本文转自:http://msdn.microsoft.com/zh-cn/library/ms178473(VS.80).aspx 下表描述了 ASP.NET 应用程序生命周期的各个阶段.   阶段 ...

  9. asp.net 文件上传示例整理

    ASP.NET依托.net framework类库,封装了大量的功能,使得上传文件非常简单,主要有以下三种基本方法. 方法一:用Web控件FileUpload,上传到网站根目录.  代码如下 复制代码 ...

随机推荐

  1. Java 如何连接 SQL 2008 R2

    前提: 1. 复制sqljdbc_auth.dll到C:\Windows\System32这个路径下. 2. 添加sqljdbc4.jar到Libraries里面. 代码示例: import java ...

  2. 如何使用VSTS做压力测试

    1 前言 1.1 目的 本文档主要介绍如何在VSTS环境中进行LoadTest测试,给测试人员和初次使用者提供参考. 对该工具进行LoadTest测试的优劣进行简单的分析说明. 1.2 软件版本 本文 ...

  3. windows下回车与换行符

    windows下回车与换行符 从键盘输入的数据一般是ASCII码,也就是文本文件,在送到计算机内存时,回车和换行符转换成一个换行符(也就是说回车和换行符在windows文本中是两个字符),再从内存中以 ...

  4. Android NDK STL

    相信Android开发者都喜欢用C++编写一些高效的应用,有关Android NDK的C++开发相关知识总结如下:       从Android NDK r5开始支持了STL Port,在这个版本开始 ...

  5. cvThreshold

    看了很多很坑的文章. 呵呵哒.而且基本上都是一个地方转载的,英文翻译我用你单独给一个词条么?就不能负点儿责? cvThreshold(img4, img3, 0, 128, CV_THRESH_OTS ...

  6. 关于SQL语言的优化(Oracle)

    SQL优化的原则 尽量使用列名 --SQL 优化2: where解析的顺序 : 右--> 左 Select * from zl_yhjbqk   where   dy_dj = '1K以下'   ...

  7. 项目中 mysql中的内容关于上架时间和下架时间

    隐藏左边导航 在mysql中,是存放的10位的时间截,在后台添加时,时间的格式是:'Y-m-d H:i',没有秒的 字段 字段名称 字段类型 是否为空 默认值 备注 publish_up int(11 ...

  8. SSO单点登录之跨域问题

    第一次写博客,与大家共勉. 这里用到的原理其实非常简单,将cookie存在一个公共的站点的页面上就可以了,这里我们管那个站点叫主站S. 先说说所谓的跨域 环境1:a.xxx.com需要跟b.xxx.c ...

  9. asp.net中常用的几种身份验证方式

    转载:http://www.cnblogs.com/dinglang/archive/2012/06/03/2532664.html   前言 在B/S系统开发中,经常需要使用"身份验证&q ...

  10. Sql三种分页方法

    --分页三种方法--第一种 ROW_NUMBER() OVER( ORDER BY OrgID) AS indexs 大于pagesize*pageindex,少于等于pagesize*(pagein ...