批量去除Teleport Pro整站下载文件冗余代码
teleport pro tppabs标签批量删除
teleport pro tppabs标签批量删除
使 用Teleport Pro下载的网页代码中包含了很多垃圾代码,比如下载的html网页代码中会出现tppabs标签,而且还会将所有的href标签中加入了很多垃圾代码, 在css会加入了tpa标签,这些都是冗余代码,可以将其全部删除,但是由于代码太多,我们不可能一个个删除,因此可以使用Dreamweaver的查找 /替换工具中的正则表达式来进行替换。
1、替换tppabs标签,使用Dreamweaver查找\btppabs="h[^"]*",将其替换为空即可。
2、替换href中的多余代码,使用Dreamweaver查找href="javascript:if\(confirm\('htt[^"]*"替换为href=""即可。
3、替换css文件中的tpa标签,使用Dreamweaver查找/\*tpa=.*\*/替换为空即可。
----------------------------------------------------------------------------------------------------------------------------------------
tppabs
html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。
如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。
方法如下:
使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:\btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可
匹配javascript代码:
<a href="javascript: if(confirm('http://www.xxx.com \n\n文件并未依 Teleport Pro 取回,因为服务器报告错误导致无法读取。 \n\n你要从服务器上打开它吗?'))window.location='http: //www.xxx.com'" >
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if\(confirm\('htt[^"]*"
替换:href=""
勾选:使用正则表达式
点替换全部按钮
注:如果该表达式中含有不同的网址,可使用if\(confirm\('htt[^"]*\)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。
css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:\/\*tpa=http://[^\s]*\/
替换:空
勾选:使用正则表达式
点替换全部按钮
字符匹配示例^输入或行的起始部分。^T 匹配“This good earth”中的“T”,但不匹配“Uncle Tom's Cabin”中的“T”。$输入或行的结尾部分。h$ 匹配“teach”中的“h”,但是不匹配“teacher”中的“h”*0 个或多个前置字符。um* 匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u”+1 个或多个前置字符。um+ 匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项?前置字符最多出现一次(即,指示前置字符是可选的)。st?on 匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项.除换行符外的任何单字符。.an 匹配短语“bran muffins can be tasty”中的“ran”和“can”x|yx 或 y。FF0000|0000FF 匹配 bgcolor=”#FF0000” 中的“FF0000”和 font color=”#0000FF” 中的“0000FF”{n}恰好 n 个前置字符。o{2} 匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项{n,m}至少 n 个、至多 m 个前置字符。F{2,4} 匹配“#FF0000”中的“FF”和“#FFFFFF”中的前四个“F”[abc]用括号括起来的字符中的任何一个字符。用连字符指定某一范围的字符(例如, [a-f] 等效于 [abcdef])。 [e-g] 匹配“bed”中的“e”、“folly”中的“f”和“guard”中的“g”[^abc]未在括号中括起来的任何字符。用连字符指定某一范围的字符(例如,[^a-f] 等效于[^abcdef])。[^aeiou] 最初匹配“orange”中“r”、“book”中的“b”和“eek!”中的“k”\b词边界(例如空格或回车符)。\bb 匹配“book”中的“b”,但在“goober”和“snob”中没有任何匹配项\B词边界之外的任何内容。\Bb 匹配“goober”中的“b”,但在“book”中没有任何匹配项\d任何数字字符。等效于 [0-9]。\d 匹配“C3PO”中的“3”和“apartment 2G”中的“2”\D任何非数字字符。等效于 [^0-9]。\D 匹配“900S”中的“S”和“Q45”中的“Q”\f换页符。 \n换行符。 \r回车符。 \s任何单个空白字符,包括空格、制表符、换页符或换行符。\sbook 匹配“blue book”中的“book”,但在“notebook”中没有任何匹配项\S任何单个非空白字符。\Sbook 匹配“notebook”中的“book”,但在“blue book”中没有任何匹配项\t制表符。 \w任何字母数字字符,包括下划线。等效于 [A-Za-z0-9_]。b\w* 匹配“the barking dog”中的“barking”以及“the big black dog”中的“big”和“black”\W任何非字母数字字符。等效于 [^A-Za-z0-9_]。\W 匹配“Jake&Mattie”中的
关键词:取出tppabs标记,去除tppabs标记,批量去除tppabs标记www.oine.cn
批量去除Teleport Pro整站下载文件冗余代码的更多相关文章
- [转]最全的用正则批量去除Teleport Pro整站下载文件冗余代码
原文地址:http://www.jb51.net/article/43650.htm html原文件中tppabs标记是Teleport Pro软件留下的标记.该软件是离线浏览器,下载完整个网页后,它 ...
- 去除整站下载文件中的tppabs等冗余代码
用TeleprotUltra复制了一个网站,结果网页中出现了很多形如tppabs=””的冗余代码,点击vs中的“在文件中查找”图标,打开“查找和替换”对话框,转到“快速替换”,然后进行以下设置: “查 ...
- Windows中使用wget整站下载
weget wget安装 Windows下载 点击下载 https://eternallybored.org/misc/wget/ 会跳转到wget的下载页,根据自己电脑选择下载的文件,我下载的版 ...
- Linux系统下利用wget命令把整站下载做镜像网站
Linux系统下利用wget命令把整站下载做镜像网站 2011-05-28 18:13:01 | 1次阅读 | 评论:0 条 | itokit 在linux下完整的用wget命令整站采集网站做镜像 ...
- Python 实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 QQ:1033553122 实现功能 1 测试环境 1 使用方法 1 1. 编辑配置文件conf/file_for_downl ...
- php下载文件的代码示例
php下载文件的代码示例,需要的朋友可以参考下 <?php $file = 'monkey.gif'; if (file_exists($file)) { header('Content- ...
- 整站下载工具Teleport Pro
http://zmingcx.com/download-tools-teleport-pro-full-stop.html Teleport Pro是一款功能强大的离线浏览器,不论规模多大的网站,只要 ...
- 批量重命名B站下载文件
将B站下载的文件统一修改文件名 事情来由 事情是这样的,我在B站上发现一个教程,看了一下,非常不错,于是想下载下来(免得B站和谐). 问题就是这样来了,我手机没多少内存,下载后下发现文件在手机中都是以 ...
- 数据挖掘_wget整站下载
你应该了解的所有wget命令 翻译自All the Wget Commands You Should Know 如何下载整个网站用来离线浏览?怎样将一个网站上的所有MP3文件保存到本地的一个目录中?怎 ...
随机推荐
- Android AsyncTask 源码解析
1. 官方介绍 public abstract class AsyncTask extends Object java.lang.Object ↳ android.os.AsyncTask&l ...
- Xcode快捷键大全
转载地址http://www.360doc.com/content/12/0521/09/6541311_212458595.shtml.
- VBA 操作数字
第8章 操作数字 加.减.乘.除.平方与指数(^2 或者^n).平方根Sqr.正弦Sin.余弦Cos.正切Tan.反正切Atn.绝对值Abs 转换为整型数.长整型数.双精度型数和值 Cint当双精度型 ...
- 分页查询的SQL语句
select * from(select row_number() over (ORDER BY Id DESC) cyqrownum,t.* from [Table_TY_Member] t ) v ...
- 区别和详解:js中call()和apply()的用法
1.关于call()和apply()的疑点: apply和call的区别在哪里 什么情况下用apply,什么情况下用call apply的其他巧妙用法(一般在什么情况下可以使用apply) 2.语法和 ...
- JavaScript Patterns 5.6 Static Members
Public Static Members // constructor var Gadget = function (price) { this.price = price; }; // a sta ...
- Windows服务调试小结(附Demo)
本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 阅读目录 介绍 搭建环境 调试方式 Demo下载 本文版权归mephisto和博客园共有,欢迎转载,但须 ...
- Java设计模式 - 适配器模式
概念: 将一个类的接口,转换成客户期望的另一个接口.适配器模式让原来接口不兼容的类可以在一起工作. 解决的问题: 提供类似于中间人的作用:把原本不兼容.不能一起工作的接口组合在一起,使得它们能够在一起 ...
- Linux开机启动(bootstrap)
计算机开机是一个神秘的过程.我们只是按了开机键,就看到屏幕上的进度条或者一行行的输出,直到我们到达登录界面.然而,计算机开机又是个异常脆弱的过程,我们满心期望的登录界面可能并不会出现,而是一个命令行或 ...
- 将u盘的文件复制到虚拟机上的linux系统上面—》文件挂载(文字+图解)
虚拟机中操作系统.CentOs(无图形界面) 没有图形界面的linux,我也没有配置网络,现在需要把文件复制到linux系统上面,我这里就使用了u盘挂载的方式,获得了U盘中的文件. 1.VMware中 ...