为什么备选的顺序在正则表达式中很重要?
码
using System; using System.Text.RegularExpressions; namespace RegexNoMatch { class Program { static void Main () { string input = "a foobar& b"; string regex1 = "(foobar|foo)&?"; string regex2 = "(foo|foobar)&?"; string replace = "$1"; Console.WriteLine(Regex.Replace(input, regex1, replace)); Console.WriteLine(Regex.Replace(input, regex2, replace)); Console.ReadKey(); } } }
预期产出
a foobar b a foobar b
实际输出
a foobar b a foobar& b
题
当正则表达式中“foo”和“foobar”的顺序发生变化时,为什么替换不起作用? 如何解决这个问题?
正则表达式引擎尝试按照指定顺序匹配备选方案。 那么当模式是(foo|foobar)&?
它立即匹配foo
并继续尝试找到匹配。 输入字符串的下一位是bar& b
,无法匹配。
换句话说,因为foo
是foobar
一部分,所以没有办法(foo|foobar)
将匹配foobar
,因为它总是首先匹配foo
。
实际上,偶尔,这可能是一个非常有用的技巧。 模式(o|a|(\w))
将允许您以不同方式捕获\w
和a
或o
:
Regex.Replace("a foobar& b", "(o|a|(\\w))", "$2") // fbr& b