基本正则与扩展正则

上一篇学习了一些文本处理的工具之后，发现grep支持的正则包含基本正则和扩展正则，之前没有系统的学习过这些正则的细节和区别，现在学习一下。

基本正则表达式(BRE, basic regular expressions)

[]匹配其中的任一字符

1 2	`x@LAPTOP-MRV29Q6U$ echo "abcdABCD"\|grep "a[a-z]" ab`

[^]匹配非其中的字符

1 2	`x@LAPTOP-MRV29Q6U$ echo "abcdABCD"\|grep "A[^a-z]" AB`

用来指定所给出的匹配字符，出现的次数，满足限定才会被匹配出来

确定匹配子串出现的位置。

符号	含义
^	匹配行首，用在pattern的最左侧
$	匹配行尾，用在pattern的最右侧
\<pattern	以对应匹配为词首的单词
pattern\>	以对应匹配为词尾的单词
\b	表示单词的边界，既可以表示单词的词首，也可以表示单词的词尾

通过\ (\ ) 将一个或多个字符捆绑在一起，当作一个整体进行处理，如：\ (root\ )\ + 匹配 root 字符至少一次如 root，rootroot，rootrootroot

后向引用：\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符结果，而不是相应的模式；同样，\2代表左起第二个左括号和与其匹配的右括号之间的模式所匹配到的结果

\|: 匹配或条件，比如：\ (C\ |c \ )at 可以匹配Cat 或cat。

扩展正则表达式可以认为是对基础正则的简化，直观上的表现：
如进行分组时基础正则使用，而扩展正则，则直接使用()
grep sed 等文本处理工具，配上指定的选项，可进行扩展正则的使用， grep -E 或 egrep

与基础正则一致

通过() 将一个或多个字符捆绑在一起，当作一个整体进行处理，如：(root)+ 匹配 root 字符至少一次如 root，rootroot，rootrootroot

|: 匹配或条件，比如：(C |c )at 可以匹配Cat 或cat。

这两者的区别是：正则表达式的扩展规范和基本规范基本相同。只是在基本规范下，有些字符（? + {} | () ）应解释为普通字符，要表达上述特殊含义，则需要加 \ 转义。反之，在扩展规范下，? + {} | () 应被理解成特殊含义，要取其字面值，也要对其进行 \ 转义。

#正则

基本正则与扩展正则

https://chujian521.github.io/blog/2022/11/25/基本正则与扩展正则/

作者

Encounter

发布于

2022年11月25日

许可协议