为什么备选的顺序在正则表达式中很重要?

using System; using System.Text.RegularExpressions; namespace RegexNoMatch { class Program { static void Main () { string input = "a foobar& b"; string regex1 = "(foobar|foo)&?"; string regex2 = "(foo|foobar)&?"; string replace = "$1"; Console.WriteLine(Regex.Replace(input, regex1, replace)); Console.WriteLine(Regex.Replace(input, regex2, replace)); Console.ReadKey(); } } } 

预期产出

 a foobar b a foobar b 

实际输出

 a foobar b a foobar& b 

当正则表达式中“foo”和“foobar”的顺序发生变化时,为什么替换不起作用? 如何解决这个问题?

正则表达式引擎尝试按照指定顺序匹配备选方案。 那么当模式是(foo|foobar)&? 它立即匹配foo并继续尝试找到匹配。 输入字符串的下一位是bar& b ,无法匹配。

换句话说,因为foofoobar一部分,所以没有办法(foo|foobar)将匹配foobar ,因为它总是首先匹配foo

实际上,偶尔,这可能是一个非常有用的技巧。 模式(o|a|(\w))将允许您以不同方式捕获\wao

 Regex.Replace("a foobar& b", "(o|a|(\\w))", "$2") // fbr& b