利用正则提取discuz的正文内容
源正文:
[p=24, null, left][color=#000][font=宋体]近日,香港著名漫画家马荣成在香港举办的“[color=#ff660][url=http://cul.china.com.cn/2013-08/04/content_6179875.htm#]风云[/url][/color]盛宴”上宣布封笔,并宣布即将完结连载24年的《风云》漫画。[/font][/color][/p][p=24, null, left][color=#000][font=宋体]“风云”是幻想式武侠故事,主要围绕聂风和步惊云展开。从1989年开始连载,至今已有24年。漫友杂志社社长兼总编辑金城说,[color=#ff660][url=http://cul.china.com.cn/2013-08/04/content_6179875.htm#]香港漫画[/url][/color]市场销量近年一直下滑,内地漫画市场还好,但香港漫画衰退很快,读者越来越少,这也成为马荣成封笔的直接原因,因为他不再有画下去的动力。[/font][/color][/p][p=24, null, left][color=#000][font=宋体]52岁的马荣成表示,五年前就萌生退意,两年前决定封笔,“因为不想再为延续销量而不断消磨自己的斗志,与其让主角无限次受伤、离别及永远的化险为夷,宁愿干脆地给故事来个完美的结局。”马荣成也提到,由于香港漫画市场走低,《风云》最高峰销量达14万本,如今已跌至4万,不过仍居当地漫画销量榜首。[/font][/color][/p]
目标正文:
近日,香港著名漫画家马荣成在香港举办的“风云盛宴”上宣布封笔,并宣布即将完结连载24年的《风云》漫画。“风云”是幻想式武侠故事,主要围绕聂风和步惊云展开。从1989年开始连载,至今已有24年。漫友杂志社社长兼总编辑金城说,香港漫画市场销量近年一直下滑,内地漫画市场还好,但香港漫画衰退很快,读者越来越少,这也成为马荣成封笔的直接原因,因为他不再有画下去的动力。52岁的马荣成表示,五年前就萌生退意,两年前决定封笔,“因为不想再为延续销量而不断消磨自己的斗志,与其让主角无限次受伤、离别及永远的化险为夷,宁愿干脆地给故事来个完美的结局。”马荣成也提到,由于香港漫画市场走低,《风云》最高峰销量达14万本,如今已跌至4万,不过仍居当地漫画销量榜首。
源代码如下:
$re_message = preg_replace('/\[[^\[\]]+\]/i', '', $result['message']);//去除格式
利用正则提取discuz的正文内容的更多相关文章
- Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170114
年前有点忙,没来的及更博,最近看爬虫正则的部分 巩固下 1.爬取的单页面:http://blog.csdn.net/column/details/why-bug.html 2.过程 解析url获得网站 ...
- python利用正则表达式提取文本中特定内容
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
- 利用正则取出Stirng中“”引号内的内容
// 取出所有""中间的内容,正则如下 Pattern pattern1 = Pattern.compile("(?<=\")([\\S]+?)(?=\& ...
- 如何提取CSDN博客正文内容
document.getElementById("article_content").outerHTML; 在任意的一片博文运行以上代码都可以获得正文内容,但是对于代码.字体都没有 ...
- 帝国CMS批量提取正文内容到简介
最近接到一个帝国CMS模板改版项目,自带的数据可能是采集的,以前的简介字段内容只截取了60个字,新模板的简介60字符太少了,不美观,想让简介都截取200个字,怎么批量修改呢,文章太多了手动改肯定不行, ...
- c# 使用正则表达式 提取章节小说正文全本篇
这一节主要内容是使用正则表达式提取网站的正文,主要面向于小说章节网站.其中涉及到一些其他知识点,比如异步读取.异步流写入等,代码中都会有详细的注解.现在流行的网络文学都是每日一更或几更,没有一个统一的 ...
- dede模版列表调用文章正文内容的方法
在制作织梦模板的时候,有的时候我们需要调用文章部分内容,用[field:description/]标签字数不够多(数据库设计字段是varchar(255)的),另外修改了文章内容但是摘要还需要手动修改 ...
- 提取HTML的正文类
本文转载:http://blog.csdn.net/cjh200102/article/details/6824895 //2.提取html的正文 类 using System; using Syst ...
- Jmeter正则提取器常用的几种方式
使用jmeter的同学都知道,jmeter提供了各种各样的提取器,如jsonpath.Beanshell.Xpath.正则等!!! 我们就针对正则提取器如何使用进行说明. 举例说明:假设取sessio ...
随机推荐
- std::function(3)
#include <functional> #include <string> #include <iostream> using namespace std; v ...
- HDU 5892 Resident Evil
题目链接:传送门 题目大意:有50种动物,给你n*n的矩阵,m次操作,P代表加入操作,在左上角 x1,y1 到右下角 x2,y2,的矩形范围内加入 种类为x,数量为y的动物. Q代表询问操作,在左上角 ...
- storyboard设置navigation controller
到storyboard选中我们唯一一个的viewcontroller,找到xcode的菜单栏,Edit->Embed In->NavigationController.这时候storybo ...
- Vue.js_数据绑定
一.文本 data {{data}} <div id="div1">{{message}}</div> <script> var div1 = ...
- TADDConnetion组件,TADOQuery
一.TADDConnetion 二.TADOQuery 1.RecNo:从1开始 当前记录行数;ADOQuery1.RecNo 选择后一行数据集内容:ADOQuery1.RecNo:=ADOQuery ...
- Oracle 数据库的组成(instance+database)
Oracle服务器是一种对象关系数据库管理系统,它为信息管理提供开放.综合.集成的方法. Oracle服务器中有多种进进程.内存结构和文件: Oracle服务器由一个Oracle实例和一个Oracle ...
- 使用ServiceStack缓存技术
ServiceStack 是一个高性能的 .NET Web 服务框架,简化了开发 XML.JSON.JSV 和 WCP SOAP Web 服务.它定义了符合 Martin Fowlers 数据传输对象 ...
- 直播未来属于RTMP还是HTTP
直播未来属于RTMP还是HTTP? - Tinywan - 博客园 https://www.cnblogs.com/tinywan/p/6122065.html 直播未来属于RTMP还是HTTP? H ...
- kafka-docker----(how to setup http proxy in container??)
https://github.com/wurstmeister/kafka-docker environment: KAFKA_ADVERTISED_HOST_NAME: 10.10.160.243 ...
- Hidden String---hdu5311(字符串处理)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5311 题意:从给出的串 s 中找到3个子串然后把他们连在一起问是否能够成anniversary #in ...