DIH处理包含回车符换行符html标签内容的文本
数据样例:2010-03-19 10:18:06130010543234203guqun09-12月-12liuyin18-6月 -14<P style="MARGIN-TOP: 0px; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 12pt; MARGIN-BOTTOM: 0px; TEXT-INDENT: 2em; LINE-HEIGHT: 1.5; FONT-FAMILY: 宋体; TEXT-ALIGN: justify">天翼分享是基于中国电信CDMA网络,为天翼客户提供视频、音频等多媒体信息分享服务的移动互联网产品。多媒体信息可以是客户自己录制的视频、拍摄的照片、制作的动漫或MTV等,也可以是中国电信提供的优质多媒体信息内容。
第一种方法:
使用ScriptTransformer处理回车符、换行符。
数据源:
<dataSource name="jdbc" driver="oracle.jdbc.driver.OracleDriver"
url="jdbc:oracle:thin:@127.0.0.1:1521:ORCLLI" user="kms_user" password="kms_user" />
ScriptTransformer脚本模块:
<script>
<![CDATA[
function regex(row) {
var content = row.get('CONTENT');
var regex = "\\t|\r|\n"
var p = java.util.regex.Pattern.compile(regex);
var m = p.matcher(content)
row.put('CONTENT', m.replaceAll(""));
return row;
}
]]>
</script>
document:
<entity name="tm_details" query="select t.docid as id,t.tempid,t.cruser as userid,t.crtime,t.content from TM_DETAILS t where t.type=2 and t.docid=10479"
transformer="ClobTransformer,HTMLStripTransformer,script:regex,DateFormatTransformer">
<field column="ID" name="id" />
<field column="TEMPID" name="tempid" />
<entity name="template" query="select te.name from kmstemplate te where te.id=${tm_details.TEMPID}">
<field column="NAME" name="template"/>
</entity>
<entity name="user" query="select msg.name from tb_sys_loginmsg msg where msg.login_id='${tm_details.USERID}'" >
<field column="NAME" name="cruser"/>
</entity>
<field column="CRTIME" name="crtime" dateTimeFormat="yyyy-MM-dd HH:mm:ss"/>
<entity name="doc" query="select rtrim(d.doctitle,'.htm') as title from kmsdocument d where d.docid=${tm_details.ID}">
<field column="TITLE" name="title" clob="true"/>
</entity>
<field column="CONTENT" name="content" clob="true" stripHTML="true"/>
</entity>
</document>
第二种方法:采用RegexTransformer:
document:
<entity name="tm_details" query="select t.docid as id,t.tempid,t.cruser as userid,t.crtime,t.content from TM_DETAILS t where t.type=2 and t.docid=10479"
transformer="ClobTransformer,HTMLStripTransformer,RegexTransformer,DateFormatTransformer">
<field column="ID" name="id" />
<field column="TEMPID" name="tempid" />
<entity name="template" query="select te.name from kmstemplate te where te.id=${tm_details.TEMPID}">
<field column="NAME" name="template"/>
</entity>
<entity name="user" query="select msg.name from tb_sys_loginmsg msg where msg.login_id='${tm_details.USERID}'" >
<field column="NAME" name="cruser"/>
</entity>
<field column="CRTIME" name="crtime" dateTimeFormat="yyyy-MM-dd HH:mm:ss"/>
<entity name="doc" query="select rtrim(d.doctitle,'.htm') as title from kmsdocument d where d.docid=${tm_details.ID}">
<field column="TITLE" name="title" clob="true"/>
</entity>
<field column="CONTENT" name="content" clob="true" stripHTML="true" regex="\\t|\r|\n" replaceWith=""/>
</entity>
</document>
DIH处理包含回车符换行符html标签内容的文本的更多相关文章
- T-SQL的回车和换行符(SQL)
T-SQL的回车和换行符(SQL) sql server中的回车换行字符是 char(13)+char(10) 回车:char(13) 换行:char(10) 实例1: DECLARE @c NVA ...
- windows下回车与换行符
windows下回车与换行符 从键盘输入的数据一般是ASCII码,也就是文本文件,在送到计算机内存时,回车和换行符转换成一个换行符(也就是说回车和换行符在windows文本中是两个字符),再从内存中以 ...
- ORACLE:除去回车符,换行符
ORACLE:除去回车符,换行符 replace(fa,chr(),'') ; --- 除去回车符 replace(fa,chr(),'') ; --- 除去换行符
- SQL替换制表、回车、换行符和首尾空格
SQL替换制表.回车.换行符和首尾空格 最近在批量修复数据的时候,需要利用excel导入大量数据.客户提供的数据是没有规范的,大部分数据行都有制表符.回车符.换货符,以及我需要将数据进行首位去重. 目 ...
- 清除SQL数据库文本字段中的回车、换行符的方法
清除SQL数据库中文本字段的回车.换行符的方法 清除回车符: update tableName set columnName = rtrim(ltrim(replace(columnName ,cha ...
- Oracle—回车、换行符
1.回车换行符 chr(10)是换行符, chr(13)是回车, 增加换行符: select ' update ' || table_name || ' set VALID_STATE =''0A'' ...
- 换行符javajava去除字符串中的空格、回车、换行符、制表符
在改章节中,我们主要介绍换行符java的内容,自我感觉有个不错的建议和大家分享下 每日一道理 只有启程,才会到达理想和目的地,只有拼搏,才会获得辉煌的成功,只有播种,才会有收获.只有追求,才会 ...
- oracle 回车、换行符
1.回车换行符 chr(10)是换行符,chr(13)是回车, 增加换行符 select ' update ' || table_name || ' set VALID_STATE ='' ...
- SQL Server:替换文本中的回车和换行符
--替换回车符 update master_locationSET street_number = REPLACE(street_number, CHAR(13), '') --替换换行符 updat ...
随机推荐
- jQuery - Chaining
jQuery - Chaining @(编程) 通过 jQuery,您可以把动作/方法链接起来. Chaining 允许我们在一条语句中允许多个 jQuery 方法(在相同的元素上). jQuery ...
- linux下 ls 排序
ls -lS 按大小降序排列 ls -l | sort -n -k5 按大小升序 ls -lrt 按时间降 ...
- ruby中实例变量、类变量等等的区别和联系
ruby的变量有局部变量,全局变量,实例变量,类变量,常量. 1.局部变量 局部变量以一个小写字母开头或下划线开头 局部变量有局部作用域限制(比如一个block内),它的作用域起始于声明处,结束于该声 ...
- easyui反选全选和全不选代码以及方法的使用
首先要说明的是,onclick="javascript:这里能写方法的名字,也能写一段JS的代码,但是方法名字要带括号.",其次就是onclick=“这里写的方法名必须存在于本页面 ...
- Codeforces 467C. George and Job (dp)
题目链接:http://codeforces.com/contest/467/problem/C 求k个不重叠长m的连续子序列的最大和. dp[i][j]表示第i个数的位置个序列的最大和. 前缀和一下 ...
- 在VSTO界面中,调用xll中的函数
最近研究各种有点迷茫了,原来Xll的加载宏直接可以在C#中调用的,我又各种Out了. 先说明一下,在VBA中,如何调用吧 XLLFound = Application.RegisterXLL(This ...
- ssh 框架整合试例 (spring+struts2+hibernate)
1.首先用Eclipse创建一个web项目(Eclipse EE 版) new->Other-> 输入web 然后选择Dynamic Web Project->next-> 输 ...
- 在jybot下跑Selenium2Library
应用场景:项目组要将原有SeleniumLibrary写的脚本切换到Selenium2Library(后称S2L)下,但是原来有很多Java写的库,综合考虑认为还是在Jython下跑比较合适.但是安装 ...
- DOM2
DOM级别 文档类型: 节点类型: 判断节点类型(注意Node对象): <div id="container">这是一个元素节点</div> <scr ...
- AVR JTAG MKii 引脚布局 ( JTAG 和 ISP )
1,JTAG和ISP引脚复用,JTAG的TCK,TDO,TDI分别与ISP的SCK,MISO,MOSI复用:2,VT引脚必须接目标板电源,不然仿真器接口电路不工作: JTAG接口引脚定义如下 标配的J ...