正则表达式替换多个组
我想使用正则表达式来替换具有相应替换字符串的多个组。
更换表:
- & – > __amp
- # – > __hsh
- 1 – > 5
- 5 – > 6
例如,对于以下输入字符串
a1asda&FJ#ahdk5adfls
相应的输出字符串是
a5asda__ampfj__hshahdk6adfls
有没有办法做到这一点?
给定一个定义替换的字典:
IDictionary map = new Dictionary() { {"&","__amp"}, {"#","__hsh"}, {"1","5"}, {"5","6"}, };
您可以使用它来构建正则表达式,并为每个匹配形成替换:
var str = "a1asda&fj#ahdk5adfls"; var regex = new Regex(String.Join("|",map.Keys)); var newStr = regex.Replace(str, m => map[m.Value]); // newStr = a5asda__ampfj__hshahdk6adfls
实例: http : //rextester.com/rundotnet?code = ADDN57626
这使用了一个Replace
( docs )重载,它允许您为替换指定lambda表达式。
在评论中已经指出,其中具有正则表达式语法的查找模式将无法按预期工作。 这可以通过使用Regex.Escape
和上面代码的一个小改动来克服:
var str = "a1asda&fj#ahdk5adfls"; var regex = new Regex(String.Join("|",map.Keys.Select(k => Regex.Escape(k)))); var newStr = regex.Replace(str, m => map[m.Value]); // newStr = a5asda__ampfj__hshahdk6adfls
使用string.Replace()
怎么样?
string foo = "a1asda&fj#ahdk5adfls"; string bar = foo.Replace("&","__amp") .Replace("#","__hsh") .Replace("5", "6") .Replace("1", "5");
与Jamiec的答案类似,但这允许您使用与文本不完全匹配的正则表达式,例如\.
不能与Jamiec的答案一起使用,因为你无法在字典中查找匹配。
此解决方案依赖于创建组,查找匹配的组,然后查找替换值。 它更复杂,但更灵活。
首先使地图成为KeyValuePairs的列表
var map = new List>(); map.Add(new KeyValuePair("\.", "dot"));
然后像这样创建你的正则表达式:
string pattern = String.Join("|", map.Select(k => "(" + k.Key + ")")); var regex = new Regex(pattern, RegexOptions.Compiled);
然后匹配评估器变得有点复杂:
private static string Evaluator(List> map, Match match) { for (int i = 0; i < match.Groups.Count; i++) { var group = match.Groups[i]; if (group.Success) { return map[i].Value; } } //shouldn't happen throw new ArgumentException("Match found that doesn't have any successful groups"); }
然后像这样调用正则表达式替换:
var newString = regex.Replace(text, m => Evaluator(map, m))
给定像其他答案中的字典,您可以使用“聚合”将字典中的每个模式映射到替换。 这将为您提供更大的灵活性,而另一个答案,因为您可以为每个模式提供不同的正则表达式选项。
例如,以下代码将“罗马化”希腊文本( https://en.wikipedia.org/w/index.php?title=Romanization_of_Greek§ion=3#Modern_Greek,Standard/UN ):
var map = new Dictionary() { {"α[ύυ](?=[άαβγδέεζήηίΐϊιλμνόορύΰϋυώω])", "av"}, {"α[ύυ]", "af"}, {"α[ϊΐ]", "aï"}, {"α[ιί]", "ai"}, {"[άα]", "a"}, {"β", "v"}, {"γ(?=[γξχ])", "n"}, {"γ", "g"}, {"δ", "d"}, {"ε[υύ](?=[άαβγδέεζήηίΐϊιλμνόορύΰϋυώω])", "ev"}, {"ε[υύ]", "ef"}, {"ει", "ei"}, {"[εέ]", "e"}, {"ζ", "z"}, {"η[υύ](?=[άαβγδέεζήηίΐϊιλμνόορύΰϋυώω])", "iv"}, {"η[υύ]", "if"}, {"[ηήιί]", "i"}, {"[ϊΐ]", "ï"}, {"θ", "th"}, {"κ", "k"}, {"λ", "l"}, {"\\bμπ|μπ\\b", "b"}, {"μπ", "mb"}, {"μ", "m"}, {"ν", "n"}, {"ο[ιί]", "oi"}, {"ο[υύ]", "ou"}, {"[οόωώ]", "o"}, {"ξ", "x"}, {"π", "p"}, {"ρ", "r"}, {"[σς]", "s"}, {"τ", "t"}, {"[υύϋΰ]", "y"}, {"φ", "f"}, {"χ", "ch"}, {"ψ", "ps"} }; var input = "Ο Καλύμνιος σφουγγαράς ψυθίρισε πως θα βουτήξει χωρίς να διστάζει."; map.Aggregate(input, (i, m) => Regex.Replace(i, m.Key, m.Value, RegexOptions.IgnoreCase));
返回(不修改“输入”变量:
"o kalymnios sfoungaras psythirise pos tha voutixei choris na distazei."
您当然可以使用以下内容:
foreach (var m in map) input = Regex.Replace(input, m.Key, m.Value, RegexOptions.IgnoreCase);
它确实修改了“输入”变量。
您还可以添加此项以提高性能:
var remap = new Dictionary(); foreach (var m in map) remap.Add(new Regex(m.Key, RegexOptions.IgnoreCase | RegexOptions.Compiled), m.Value);
缓存或使静态重映射字典然后使用:
remap.Aggregate(input, (i, m) => m.Key.Replace(i, m.Value));