正则表达式的编译表示形式
正則表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等
反斜线字符 (’’) 用于引用转义构造,表达式 \ 与单个反斜线匹配而 { 与左括号匹配。
根据 Java Language Specification 的要求Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其他字符转义。因此必须在字符串字面值中使用两个反斜线表示正则表达式受到保护,不被 Java 字节码编译器解释例如,當解释为正则表达式时字符串字面值 “\b” 与单个退格字符匹配,而 “\b” 与单词边界匹配字符串字面值 “(hello)” 是非法的,将导致编译时错誤;要与字符串 (hello) 匹配必须使用字符串字面值 “\(hello\)”。
a、b 或 c(简单类) |
任何字符除了 a、b 或 c(否定) |
a 到 z 或 A 到 Z,两头的字母包括在内(范围) |
d、e 或 f(交集) |
任何字符(与行结束符可能匹配也可能不匹配) |
非空白字符:[^\s] |
非单词字符:[^\w] |
输入的结尾仅用于最后的结束符(如果有的话) |
X,至少 n 次但是不超过 m 次 |
目前使用的简单的几个就是这些东西。
还有一种模式 就是在后面加上“+”这种表现的形式
比如一点小小的应鼡。这个在百度上也可以找到很多简单的应用
大家可以直接点击进去看看是怎样的。