正则表达式去除tppabs标签
用Teleport Pro把人家网页荡下来之后,总会在有URL的地方带有tppabs这个标志。
去除方法:
打开Dreamweaver或者其他有正则表达式的工具,使用正则表达式查找替换。
查找这个表达式:tppabs=\”[a-zA-z]+://[^\s]*\”
替换成你想要的就OK了。
解释:
什么是正则表达式?
正则表达式是一种用于匹配字符串中字符组合的模式。 它可以用来搜索、编辑、替换那些符合特定模式的文本。正则表达式通过定义字符的排列方式,来识别文档、数据中的特定信息。
正则表达式的语法包括各种字符和符号,用于表示不同的匹配规则。 例如,.
表示任何单个字符,*
表示前面的字符可以出现零次或多次,+
表示前面的字符可以出现一次或多次,|
表示“或”操作,()
用于分组等。此外,正则表达式还支持字符集匹配、选择符、量词等。
正则表达式在各种编程语言中都有广泛的应用,如Python、JavaScript、Java等。 在Python中,re
模块提供了丰富的正则表达式功能,可以用来进行字符串的查找、替换、分割等操作。例如,使用re.match()
可以从字符串的起始位置开始匹配一个模式,如果匹配成功,返回一个匹配对象;否则返回None。
正则表达式的发展历史可以追溯到20世纪50年代,最初用于文本编辑器中。 随着计算机技术的发展,正则表达式逐渐被广泛应用于各种编程语言和工具中,成为文本处理的重要工具。
以下是常用字符解释:
常用的元字符:
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
常用的限定符
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
常用的反义代码
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
常用分组语法
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?
(?!exp) 匹配后面跟的不是exp的位置
(?
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
尚未详细讨论的语法
\a 报警字符(打印它的效果是电脑嘀一声)
\b 通常是单词分界位置,但如果在字符类里使用代表退格
\t 制表符,Tab
\r 回车
\v 竖向制表符
\f 换页符
\n 换行符
\e Escape
\0nn ASCII代码中八进制代码为nn的字符
\xnn ASCII代码中十六进制代码为nn的字符
\unnnn Unicode代码中十六进制代码为nnnn的字符
\cN ASCII控制字符。比如\cC代表Ctrl+C
\A 字符串开头(类似^,但不受处理多行选项的影响)
\Z 字符串结尾或行尾(不受处理多行选项的影响)
\z 字符串结尾(类似$,但不受处理多行选项的影响)
\G 当前搜索的开头
\p{name} Unicode中命名为name的字符类,例如\p{IsGreek}
(?>exp) 贪婪子表达式
(?
(?im-nsx:exp) 在子表达式exp中改变处理选项
(?im-nsx) 为表达式后面的部分改变处理选项
(?(exp)yes|no) 把exp当作零宽正向先行断言,如果在这个位置能匹配,使用yes作为此组的表达式;否则使用no
(?(exp)yes) 同上,只是使用空表达式作为no
(?(name)yes|no) 如果命名为name的组捕获到了内容,使用yes作为表达式;否则使用no
(?(name)yes) 同上,只是使用空表达式作为no