[转]最全的用正则批量去除Teleport Pro整站下载文件冗余代码
原文地址:http://www.jb51.net/article/43650.htm
html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。
如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。

方法如下:
使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:\btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可

匹配javascript代码:
<a href="javascript: if(confirm('http://www.xxx.com \n\n文件并未依 Teleport Pro 取回,因为服务器报告错误导致无法读取。 \n\n你要从服务器上打开它吗?'))window.location='http: //www.xxx.com'" >
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if\(confirm\('htt[^"]*"
替换:href=www.xxx.com
勾选:使用正则表达式
点替换全部按钮
注:如果该表达式中含有不同的网址,可使用if\(confirm\('htt[^"]*\)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。
css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:\/\*tpa=http://[^\s]*\/
替换:空
勾选:使用正则表达式
点替换全部按钮
| 字符 | 匹配 | 示例 |
| ^ | 输入或行的起始部分。 | ^T 匹配“This good earth”中的“T”,但不匹配“Uncle Tom's Cabin”中的“T”。 |
| $ | 输入或行的结尾部分。 | h$ 匹配“teach”中的“h”,但是不匹配“teacher”中的“h” |
| * | 0 个或多个前置字符。 | um* 匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u” |
| + | 1 个或多个前置字符。 | um+ 匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项 |
| ? | 前置字符最多出现一次(即,指示前置字符是可选的)。 | st?on 匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项 |
| . | 除换行符外的任何单字符。 | .an 匹配短语“bran muffins can be tasty”中的“ran”和“can” |
| x|y | x 或 y。 | FF0000|0000FF 匹配 bgcolor=”#FF0000” 中的“FF0000”和 font color=”#0000FF” 中的“0000FF” |
| {n} | 恰好 n 个前置字符。 | o{2} 匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项 |
| {n,m} | 至少 n 个、至多 m 个前置字符。 | F{2,4} 匹配“#FF0000”中的“FF”和“#FFFFFF”中的前四个“F” |
| [abc] | 用括号括起来的字符中的任何一个字符。用连字符指定某一范围的字符(例如, [a-f] 等效于 [abcdef])。 | [e-g] 匹配“bed”中的“e”、“folly”中的“f”和“guard”中的“g” |
| [^abc] | 未在括号中括起来的任何字符。用连字符指定某一范围的字符(例如,[^a-f] 等效于[^abcdef])。 | [^aeiou] 最初匹配“orange”中“r”、“book”中的“b”和“eek!”中的“k” |
| \b | 词边界(例如空格或回车符)。 | \bb 匹配“book”中的“b”,但在“goober”和“snob”中没有任何匹配项 |
| \B | 词边界之外的任何内容。 | \Bb 匹配“goober”中的“b”,但在“book”中没有任何匹配项 |
| \d | 任何数字字符。等效于 [0-9]。 | \d 匹配“C3PO”中的“3”和“apartment 2G”中的“2” |
| \D | 任何非数字字符。等效于 [^0-9]。 | \D 匹配“900S”中的“S”和“Q45”中的“Q” |
| \f | 换页符。 | |
| \n | 换行符。 | |
| \r | 回车符。 | |
| \s | 任何单个空白字符,包括空格、制表符、换页符或换行符。 | \sbook 匹配“blue book”中的“book”,但在“notebook”中没有任何匹配项 |
| \S | 任何单个非空白字符。 | \Sbook 匹配“notebook”中的“book”,但在“blue book”中没有任何匹配项 |
| \t | 制表符。 | |
| \w | 任何字母数字字符,包括下划线。等效于 [A-Za-z0-9_]。 | b\w* 匹配“the barking dog”中的“barking”以及“the big black dog”中的“big”和“black” |
| \W | 任何非字母数字字符。等效于 [^A-Za-z0-9_]。 | \W 匹配“Jake&Mattie”中的 |
[转]最全的用正则批量去除Teleport Pro整站下载文件冗余代码的更多相关文章
- 批量去除Teleport Pro整站下载文件冗余代码
teleport pro tppabs标签批量删除 teleport pro tppabs标签批量删除 使 用Teleport Pro下载的网页代码中包含了很多垃圾代码,比如下载的html网页代码中会 ...
- 去除整站下载文件中的tppabs等冗余代码
用TeleprotUltra复制了一个网站,结果网页中出现了很多形如tppabs=””的冗余代码,点击vs中的“在文件中查找”图标,打开“查找和替换”对话框,转到“快速替换”,然后进行以下设置: “查 ...
- Python 实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 QQ:1033553122 实现功能 1 测试环境 1 使用方法 1 1. 编辑配置文件conf/file_for_downl ...
- 批量重命名B站下载文件
将B站下载的文件统一修改文件名 事情来由 事情是这样的,我在B站上发现一个教程,看了一下,非常不错,于是想下载下来(免得B站和谐). 问题就是这样来了,我手机没多少内存,下载后下发现文件在手机中都是以 ...
- linux批量远程多服务器FTP并下载文件的脚本
#!/bin/bashtime=`date +%Y%m`day=`date -d '-1 days' +%Y%m%d`localDir="/DBBackup/GameDB"cd $ ...
- Teleport Ultra/Teleport Pro的冗余代码批量清理方法
Teleport Pro 是款优秀的网站离线浏览工具(即网站整站下载工具),Teleport Ultra是其增强版,但使用此系列软件下载的离线网页里会包含大量冗余代码(如tppabs),手动去修改工作 ...
- [转]Teleport Ultra/Teleport Pro的冗余代码批量清理方法
原文地址:http://www.abcd9.com/?post=402 Teleport Pro 是款优秀的网站离线浏览工具(即网站整站下载工具),Teleport Ultra是其增强版,但使用此系列 ...
- 多表批量导出txt及打压缩包下载
在一些特殊的业务系统中,有些客户查看报表数据时不需要在浏览器上逐一查看,需要在页面端选择要查看的报表名称(可多选),选择条件,然后将所选中的报表批量导出到txt文件中并且要把批量导出的结果文件打 ...
- bat批量去除文件首行和合并到文件
bat批量去除文件首行 set n=1 :starline for %%j in (*.txt) do ( :3 if exist D:\work\test\new_%n%.txt (set /a n ...
随机推荐
- 再说Android RecyclerView局部刷新那个坑
RecyclerView局部刷新大家都遇到过,有时候还说会遇见图片闪烁的问题. 优化之前的效果: 优化之后的效果: 如果想单独更新一个item,我们通常会这样做,代码如下: mLRecyclerV ...
- Python 文件 seek() 方法
概述 Python 文件 seek() 方法用于移动文件读取指针到指定位置. 语法 seek() 方法语法如下: fileObject.seek(offset[,whence]) 参数 offset ...
- 查看指定java进程的jvm参数配置命令之jinfo
一.查看所有的参数 jinfo -flags PS:3739为JAVA进程ID Attaching to process ID , please wait... Debugger attached s ...
- 在ToolStrip中加入具有更好体验性的DateTimePicker
一. 需求的产生 很多时候,需要根据年月或日期来检索数据.在我的数据库中,如果只需要以月为单位,我一般按照200801这样的格式(yyyyMM)保存为int类型.在做数据检索时,是根据工具栏 ...
- 《自己动手写框架2》:用200行的DBF解析器来展示良好架构设计
因为工作关系.须要工作其中,须要读取DBF文件.找了一些DBF读取开源软件,要么是太过庞大,动不动就上万行.要么是功能有问题,编码,长度,总之是没有找到一个很爽的. 在万般无奈之下,我老人家怒从心头起 ...
- 【蓝桥杯】PREV-21 回文数字
题目链接:http://lx.lanqiao.org/problem.page? gpid=T113 历届试题 回文数字 时间限制:1.0s 内存限制:256.0MB 问题描写叙 ...
- 近期对招聘Android开发者的一些思考
公司要招聘Android开发者,故面试了大概十来个人.由于是小公司,所以来的人大多是90后,比較年轻.90后大概二十三四岁吧,从简历上看都写了一到两年的工作经验. 也由于是小公司,所以对工作经验这些没 ...
- [转]Maven - 环境配置
Maven 是一个基于 Java 的工具,所以要做的第一件事情就是安装 JDK. 系统要求 项目 要求 JDK Maven 3.3 要求 JDK 1.7 或以上Maven 3.2 要求 JDK 1.6 ...
- 从代码上解决Jenkins 发送邮件中文乱码问题
在实践中,使用Jenkins发送测试报告,收到邮件,邮件内容中的中文为乱码,邮件发送的方式是在Jenkins发邮件设置中设置邮件内容为:${FILE,path="report_ug.html ...
- 《Java Concurrency》读书笔记,构建线程安全应用程序
1. 什么是线程安全性 调用一个函数(假设该函数是正确的)操作某对象常常会使该对象暂时陷入不可用的状态(通常称为不稳定状态),等到操作完全结束,该对象才会重新回到完全可用的状态.如果其他线程企图访问一 ...