JAVA正则表达式匹配符
Java中正则表达式与之前使用的Python是有区别的,区别在于Java对于反斜线()处理的不同。
在Python中"\d"表示 匹配一位数字(0-9),而Java中匹配一位数字(0-9),需要的正则表达式为"\d"。
不过换行符和制表符只需要单反斜线“\n\t”。
字符
| 字符 |
描述 |
| B |
指定字符B |
| \xhh |
十六进制值为oxhh的字符 |
| \uhhhh |
十六进制值为oxhhhh的Unicode字符 |
| \t |
tab |
| \n |
换行 |
| \r |
回车 |
| \e |
转义 |
字符类
| 字符类 |
描述 |
| . (小数点) |
任意字符 |
| [abc] |
[ ] 中括号,包含a,b,c中任意字符 |
| [^abc] |
[ ]中括号加^, 表示否定,除a,b,c之外的 |
| [a-z] |
从a到z的任意字符 |
| [a-z&&[hi]] |
&&表示交集,即包含h或i |
| \s |
空白字符,包含空格,换行,回车,tab,换页 |
| \S |
大写为小写的取反,非空白字符,等价于[^\s] |
| \d |
数字0-9 |
| \D |
非数字,等价于[^0-9] |
| \w |
词字符,数字,大小写字母,等价于[0-9a-zA-Z] |
| \W |
非词,等价于[^\w] |
逻辑操作符
| 逻辑操作符 |
描述 |
| XY |
Y跟在X后面,并且XY同时满足 |
| X|Y |
X或者Y |
| (X) |
() 小括号表示捕获组(group),可以对group进行处理,尤其是获取其中的内容 |
边界匹配符
| 边界匹配符 |
描述 |
| ^ |
一行的开始 |
| $ |
一行的结束 |
| \b |
词的边界 |
量词
量词描述了一个模式匹配文本的方式,包含
- 贪婪型:量词默认是贪婪的,发现尽可能多的匹配
- 勉强型:通过问号(?)指定,匹配最小的字符数,也称为懒惰型,最少匹配,非贪婪。
- 占有型:通过加号(+)指定,当用于字符串时防止匹配失败时回溯。
| 贪婪型 |
勉强型 |
占有型 |
描述 |
| X? |
X?? |
X?+ |
匹配0个或1个X |
| X* |
X*? |
X*+ |
匹配0个或多个X |
| X+ |
X+? |
X++ |
匹配1个或多个X |
| X{n} |
X{n}? |
X{n}+ |
恰好匹配n个X |
| X{n,} |
X{n,}? |
X{n,}+ |
至少匹配n个X |
| X{n,m} |
X{n,m}? |
X{n,m}+ |
至少匹配n个X,最多匹配m个X |