利用正则提取discuz的正文内容
源正文:
[p=24, null, left][color=#000][font=宋体]近日,香港著名漫画家马荣成在香港举办的“[color=#ff660][url=http://cul.china.com.cn/2013-08/04/content_6179875.htm#]风云[/url][/color]盛宴”上宣布封笔,并宣布即将完结连载24年的《风云》漫画。[/font][/color][/p][p=24, null, left][color=#000][font=宋体]“风云”是幻想式武侠故事,主要围绕聂风和步惊云展开。从1989年开始连载,至今已有24年。漫友杂志社社长兼总编辑金城说,[color=#ff660][url=http://cul.china.com.cn/2013-08/04/content_6179875.htm#]香港漫画[/url][/color]市场销量近年一直下滑,内地漫画市场还好,但香港漫画衰退很快,读者越来越少,这也成为马荣成封笔的直接原因,因为他不再有画下去的动力。[/font][/color][/p][p=24, null, left][color=#000][font=宋体]52岁的马荣成表示,五年前就萌生退意,两年前决定封笔,“因为不想再为延续销量而不断消磨自己的斗志,与其让主角无限次受伤、离别及永远的化险为夷,宁愿干脆地给故事来个完美的结局。”马荣成也提到,由于香港漫画市场走低,《风云》最高峰销量达14万本,如今已跌至4万,不过仍居当地漫画销量榜首。[/font][/color][/p]
目标正文:
近日,香港著名漫画家马荣成在香港举办的“风云盛宴”上宣布封笔,并宣布即将完结连载24年的《风云》漫画。“风云”是幻想式武侠故事,主要围绕聂风和步惊云展开。从1989年开始连载,至今已有24年。漫友杂志社社长兼总编辑金城说,香港漫画市场销量近年一直下滑,内地漫画市场还好,但香港漫画衰退很快,读者越来越少,这也成为马荣成封笔的直接原因,因为他不再有画下去的动力。52岁的马荣成表示,五年前就萌生退意,两年前决定封笔,“因为不想再为延续销量而不断消磨自己的斗志,与其让主角无限次受伤、离别及永远的化险为夷,宁愿干脆地给故事来个完美的结局。”马荣成也提到,由于香港漫画市场走低,《风云》最高峰销量达14万本,如今已跌至4万,不过仍居当地漫画销量榜首。
源代码如下:
$re_message = preg_replace('/\[[^\[\]]+\]/i', '', $result['message']);//去除格式
利用正则提取discuz的正文内容的更多相关文章
- Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170114
年前有点忙,没来的及更博,最近看爬虫正则的部分 巩固下 1.爬取的单页面:http://blog.csdn.net/column/details/why-bug.html 2.过程 解析url获得网站 ...
- python利用正则表达式提取文本中特定内容
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
- 利用正则取出Stirng中“”引号内的内容
// 取出所有""中间的内容,正则如下 Pattern pattern1 = Pattern.compile("(?<=\")([\\S]+?)(?=\& ...
- 如何提取CSDN博客正文内容
document.getElementById("article_content").outerHTML; 在任意的一片博文运行以上代码都可以获得正文内容,但是对于代码.字体都没有 ...
- 帝国CMS批量提取正文内容到简介
最近接到一个帝国CMS模板改版项目,自带的数据可能是采集的,以前的简介字段内容只截取了60个字,新模板的简介60字符太少了,不美观,想让简介都截取200个字,怎么批量修改呢,文章太多了手动改肯定不行, ...
- c# 使用正则表达式 提取章节小说正文全本篇
这一节主要内容是使用正则表达式提取网站的正文,主要面向于小说章节网站.其中涉及到一些其他知识点,比如异步读取.异步流写入等,代码中都会有详细的注解.现在流行的网络文学都是每日一更或几更,没有一个统一的 ...
- dede模版列表调用文章正文内容的方法
在制作织梦模板的时候,有的时候我们需要调用文章部分内容,用[field:description/]标签字数不够多(数据库设计字段是varchar(255)的),另外修改了文章内容但是摘要还需要手动修改 ...
- 提取HTML的正文类
本文转载:http://blog.csdn.net/cjh200102/article/details/6824895 //2.提取html的正文 类 using System; using Syst ...
- Jmeter正则提取器常用的几种方式
使用jmeter的同学都知道,jmeter提供了各种各样的提取器,如jsonpath.Beanshell.Xpath.正则等!!! 我们就针对正则提取器如何使用进行说明. 举例说明:假设取sessio ...
随机推荐
- tarjan求强连通分量+缩点 模板
#define N 100100 #define M 200200 int n,m; int id,index; //id表示缩点后点的id,index表示进行tarjan算法时访问的点先后 int ...
- java代理与动态代理的学习
静态代理比较简单,就是代理对象与被代理对象继承相同的接口,代理类负责调用被代理类(委托类)的对象的相关方法去提供具体的服务,一个代理类只能为一个接口服务,要是有很多服务的话需要开很多代理类.而动态代理 ...
- 160705、总结:commons-codec.jar中常用方法
一.Base64编码和解码import org.apache.commons.codec.EncoderException;import org.apache.commons.codec.binary ...
- 用RSS订阅微信公众号
现在用RSS的人应该不多了,不过还是写一下吧. 一.付费服务:今天看啥 1.付费原因: 目前,网上几乎没有免费的用RSS订阅微信公号的方法,所以我推荐的是付费方法: 具体使用的服务是今天看啥,服务还是 ...
- Java 语言基础之数组常见操作
对数组操作最基本的动作: 存和取 核心思想: 就是对角标的操作 数组常见操作: 1, 遍历 2, 获取最大值和最小值 3, 排序 4, 查找 5, 折半查找 // 1. 遍历 int[] arr = ...
- 四.mysql演示银行转账
代码演示: #conding:utf8 import pymysql import sys class TransferMoney(object): def __init__(self,conn): ...
- Redis的Python客户端redis-py说明文档(转)
add by zhj: 对Publish / Subscribe,LUA Scripting,Sentinel support,Scan Iterators等部分没有翻译,需要的用户参见英文原文吧.另 ...
- 2017年最有价值的IT认证——From Global Knowledge
- Android Studio设置行宽、格式化断行
设置基于Android studio 1.2,其它版本可能位置不大一样,可以直接搜索 1.设置行宽 就是那条右标准线的位置:Setting-->Editor-->Code Style,右侧 ...
- CG group
Linux CGroup全称Linux Control Group, 是Linux内核的一个功能,用来限制,控制与分离一个进程组群的资源(如CPU.内存.磁盘输入输出等).这个项目最早是由Google ...