一个截取HTML文本的工具,可以按照文字字数或文字字节长度进行截取,保留HTML样式并在最后自动补齐截取后的标签。
按工作要求编写,时间紧迫,代码未优化,欢迎讨论和指正。
​1. [文件] SubHtml.js 
/**
 * 文件名:SubHtml.js
 * 作 者:DHC
 * 说 明:带HTML标签根据HTML内容截取指定长度的HTML文本,并自动补齐截取后的标签
 * 版 本:1.0
 * 时 间:2014-02-24
 * 示 例:subHtml($("#div715").html(), 73, false)
 */
(function(o){
    /**
     * 判断数组中是否包含某个元素
     */
    Array.prototype.inArray = function(v){
        for(i=0; i < this.length; i++) {
            if(this[i] == v){
                return true;
            }
        }
        return false;
    }
     
    /**
     * 将HTML字符串里面的文本字符检出
     */
    o.toText = function(oHtml){
        if(typeof oHtml === "string"){
            return oHtml.replace(/(^\s*)|(\s*$)/g, "").replace(/<[^<^>]*>/g, "").replace(/[\r\n]/g, "");
        } else {
            return "";
        }
    };
     
    /**
     * 截取带HTML样式的字符串,并保留并自动补齐HTML标签
     * oHtml  将要截取的HTML字符串
     * nlen   截取后的长度,包含标签之间的空格
     * isByte 是否按照字节长度截取
     */
    o.subHtml = function(oHtml, nlen, isByte){
        var rgx1 = /<[^<^>^\/]+>/;      //前标签(<a>的href属性中可能会有“//”符号,先移除再判断)
        var rgx2 = /<\/[^<^>^\/]+>/;    //后标签
        var rgx3 = /<[^<^>^\/]+\/>/;    //自标签
        var rgx4 = /<[^<^>]+>/;         //所有标签
        var selfTags = "hr,br,img,input,meta".split(",");
        if(typeof oHtml !== "string"){
            return "";
        }
        oHtml = oHtml.replace(/(^\s*)|(\s*$)/g, "").replace(/[\r\n]/g, "");
        var oStr = oHtml.replace(/<[^<^>]*>/g, "");
        var olen = isByte ? oStr.replace(/[^\x00-\xff]/g,"**").length : oStr.length;
        if(!/^\d+$/.test(nlen) || olen <= nlen){
            return oHtml;
        }
        var tStr = oHtml;
        var index = 0;
        var matchs = new Array();
        while(rgx4.test(tStr)){
            var m = new Object();
            m.index = index + tStr.search(rgx4);
            m.string = tStr.match(rgx4).toString();
            var len = tStr.search(/<[^<^>]+>/)+tStr.match(/<[^<^>]+>/)[0].length;
            tStr = tStr.substr(len);
            index += len;
            matchs.push(m);
        }
        if(isByte){
            var i=0;
            for(var z = 0; z < oStr.length; z++){
                i += (oStr.charCodeAt(z) > 255) ? 2 : 1;
                if(i >= nlen){
                    tStr=oStr.slice(0,(z + 1));
                    break;
                }
            }
        } else {
            tStr = oStr.substr(0, nlen);
        }
        var startTags = new Array();
        for(var i = 0; i < matchs.length; i++){
            if(tStr.length <= matchs[i].index){
                //tStr += matchs[i].string;
                matchs = matchs.slice(0, i);
                break;http://www.huiyi8.com/dongman/weimei/​
            } else {唯美动漫图片
                tStr = tStr.substring(0, matchs[i].index) + matchs[i].string + tStr.substr(matchs[i].index);
                if(rgx1.test(matchs[i].string.replace(/(\/\/)/g, ""))){
                    var name = matchs[i].string.replace(/[<>]/g, "").split(" ");
                    if(name.length > 0){
                        name = name[0];
                        if(!selfTags.inArray(name)){
                            startTags.push(name);
                        }
                    }
                } else if(rgx2.test(matchs[i].string)){
                    var name = matchs[i].string.replace(/[<\/>]/g, "");
                    if(startTags.length > 0 && startTags[startTags.length - 1] === name){
                        startTags.pop();
                    }
                }
            }
        }
        if(startTags.length > 0){
            for(var i = startTags.length - 1; i >=0; i--){
                tStr += '</' + startTags[i] + '>';
            }
        }
        return tStr;
    }
}(window));

截取带HTML标签的文本并保留文本样式的更多相关文章

  1. Jsoup提取文本时保留标签

    使用Jsoup来对html进行处理比较方便,你可能会用它来提取文本或清理html标签.如果你想提取文本时保留标签,可以使用Jsoup.clean方法,参数为html及标签白名单: Jsoup.clea ...

  2. 用Ueditor存入数据库带HTML标签的文本,从数据库取出来后,anjular用ng-bind-html处理带HTML标签的文本

    ng.module('index-filters', []) .filter('trustHtml', function ($sce) { return function (input) { retu ...

  3. vim技巧4 删除/保留文本中匹配行

    vim技巧:如何删除/保留文本中特定的行呢? <ol><a href="/ss/ss/www"> show invisibles</a> < ...

  4. wordpress调用the_excerpt()不带<p>标签

    我们知道wordpress调用摘要内容用<?php the_excerpt(); ?>就可以,但是它会自动添加一个p标签,例如<p>这里是description</p&g ...

  5. HTML标签-->段落,格式,文本

    只有努力奔跑,才能一直停留在原地. <!--段落标签--> <h1>默认向左</h1> <h1 align="right">向右对齐 ...

  6. 使用所见即所得文本编辑器编辑文本存入数据库后通过ajax获取服务器json_encode的数据到前台,文本内容上边的html标签不解析

    使用所见即所得文本编辑器编辑文本存入数据库后通过ajax获取服务器json_encode的数据到前台,文本内容上边的html标签不解析 因为我在前台使用了jquery的text()方法,而不是html ...

  7. 如何把大段文字转为带html标签的文字

    开发网页的时候,有时候会遇到大段的隐私声明,用户协议等等,我们呀要复制粘贴展示出来,必须加大量的p标签,h1,h2,空格符,br标签,这对我们来说无疑是泪崩的,有个很好的办法,可以快速给这些文字加标签 ...

  8. SpringMVC和Freemarker整合,带自定义标签的使用方法

    SpringMVC和Freemarker整合,带自定义标签的使用方法. [参考来源:http://www.360doc.com/content/14/1225/14/1007797_435663342 ...

  9. [原创]java WEB学习笔记42:带标签体的自定义标签,带父标签的自定义标签,el中自定义函数,自定义标签的小结

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

随机推荐

  1. Python标准库:1. 介绍

    标准库包括了几种不同类型的库. 首先是那些核心语言的数据类型库,比方数字和列表相关的库.在核心语言手冊里仅仅是描写叙述数字和列表的编写方式,以及它的排列,而未定义它的语义. 换一句话说,核心语言手冊仅 ...

  2. JVM的GC简介和实例

    本文是一次内部分享中总结了jvm gc的分类和一些实例, 内容是introduction级别的,供初学人士参考.成文仓促,难免有些错误,如果有大牛发现,请留言,我一定及时更正,谢谢!JVM内存布局主要 ...

  3. koajs 项目实战(二)

    此篇文章,接 koajs 项目实战(一)后写 (六)表单提交和参数接收 表单: <form method="post" action="./users/zhuce& ...

  4. 策略模式(headfirst设计模式学习笔记)

    鸭子的行为被封装 进入一组类中,能够轻易的扩展和改变.假设须要能够执行时改变行为! 策略模式定义了算法族.分别封装起来.让他们能够相互替换,此模式让算法的变化独立于使用算法的客户. 继承,相似之处用继 ...

  5. Java 使用StringBuffer注意

    Stringbuffer使用注意   问题背景: 模拟客户端使用Socket请求服务器核心系统,核心系统正常响应,内容较大,近2715KB,大于2.6M多. 使用指定编码GBK来接收响应内容到过程中没 ...

  6. HTML/CSS开发规范指南

    参见文档:https://github.com/doyoe/html-css-guide 1.文档目录结构 |-- 项目名 |-- src 开发环境 |-- html 静态页面模板目录 |-- bgi ...

  7. NorFlash linux分区分析

    一般情况下,与板卡相关的内容都在bsp中(即arch/arm/mach-xxx/board-xxx.c)中,但norflash的分区直接放在norflash驱动中.由于norflash应用基于mtd, ...

  8. HDU 5374 Tetris (2015年多校比赛第7场)

    1.题目描写叙述:点击打开链接 2.解题思路:本题要求模拟俄罗斯方块游戏.然而比赛时候写了好久还是没过. 后来补题发现原来是第四步的逻辑实现写错了... 题目中要求假设一整行能够消除,那么仍然运行该步 ...

  9. 在安装ubuntu时,卡在启动画面

    在我安装ubuntu时发生的情况,记录下来希望能帮助到需要帮助的朋友. 我先后尝试16.04与14.05两个版本的Ubuntu系统,方法均为:https://www.ubuntu.com/downlo ...

  10. Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)

    sftp -b batchfile username@remote_host 报错:Permission denied (publickey,gssapi-keyex,gssapi-with-mic, ...