✕
本课将为您介绍一些额外的元字符,以及捕获组的匹配结果。
我们已经学习了几个常用的元字符:\d
用于匹配数字,\s
用于匹配空白字符,\w
用于匹配字母数字字符。但正则表达式还提供了它们的大写形式,用来匹配相反的字符集合。例如,\D
表示匹配任何非数字字符,\S
表示匹配任何非空白字符,\W
表示匹配任何非字母数字字符(比如标点符号)。根据您具体的需求,选择使用正向或反向匹配可能会更加方便。
另外,还有一个特殊的元字符 \b
,它用来匹配单词和非单词字符之间的边界。这对于捕获完整的单词非常有用,比如使用模式 \w+\b
。
本课程中不会详细讲解的一个概念是“反向引用”,主要是因为不同正则引擎的实现有所差异。但许多系统支持通过 \0
(表示完整匹配的文本)、\1
(表示第1个捕获组)、\2
(表示第2个捕获组)等来引用捕获组。例如,在文本编辑器中用正则表达式搜索和替换时,您可以用模式 (\d+)-(\d+)
来匹配两个数字,并将其替换为 \2-\1
,这样就能将第二个数字放到第一个位置,第一个数字放到第二个位置。
下面是一些不同的字符串,您可以尝试使用不同类型的元字符,或者结合我们之前课程中学到的内容进行测试,准备好后再继续学习。