正则表达式
正则表达式
?
表示前一个字符出现的次数是0或者1次
如
used?
可以匹配到
used
use
*
表示前一个字符可以出现0次或多次
如
ab*c
可以匹配到
abc
abbbbbbbc
ac
+
表示前一个字符出现1次或多次
如
ab+c
可以匹配到
abc
abbbbbc
{}
里面输入数字,表示前一个字符出现的次数
{n}:前一个字符出现n次
{a,}:前一个字符出现次数大于等于a
{a,b}:前一个字符出现次数[a,b]次
()
如:
(ab)+
匹配:
ab
abab
ababab
|
或运算
a(b|c)
匹配:
- ab
- ac
字符类
[]:只能出现方括号里面的内容
[a-z]:所有的小写字母
[a-zA-Z]:所有的字母
[0-9]:所有的数字
[^a-z0-9]:除小写字母、数字以外的字符
元字符
\d
:数字字符
\w
:单词字符,所有的英文、数字、下划线
\s
:空白符,包括tab和换行符
\b
单词的边界 单词的开头或结尾 单词与符号之前的边界
大写则为非
.
:代表任意字符,不包括换行符
其他
^
:只会匹配行首:^a
匹配行首的a
$
:只会匹配行尾:a$
匹配行尾的a
d? d出现0/1次 a* a可以出现0/多次 a+ a出现一次以上 a{6} a出现6次 a{2,} a出现2次以上 a{2,6} a出现2-6次 匹配多个字符: (ab)+ ab出现一次以上 或运算: a (cat|dog) 匹配 a cat or a dog a cat|dog 匹配 a cat or dog 字符类: 匹配由abc构成的数据【abc】+ abc出现一次以上 abc aabbcc 【a-zA-Z0-9】 ABCabc123 ^ 排除 【^0-9】 匹配0-9之外的数据(包括换行符) 元字符 \d 数字字符 \d+ 匹配一个以上的数字 \D 非数字字符 \w 单词字符 单词 数字 下划线即英文字符 \W 非单词字符 \s 空白符 包含空格和换行符 \S 非空白字符 \b 单词的边界 单词的开头或结尾 单词与符号之前的边界 \B 非单词的边界 符号与符号 单词与单词的边界 . 任意字符不包含换行符 . 表示. 通过\进行了转意 ^ 匹配行首 $ 匹配行尾 *+{}贪婪匹配 https://www.wondershare. com <.+> 会匹配整串 因为是贪婪匹配 <.+?> 只匹配两个标签代码,➕? 设置为懒惰匹配