当字段中存在逗号和括号时，如何解析逗号分隔的字符串

我在C＃中有这个字符串

adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO

我想使用RegEx来解析它以获得以下内容：

 adj_con(CL2,1,3,0) adj_cont(CL1,1,3,0) NG NG/CL 5 value of CL(JK) HO

除了上面的例子，我测试了以下内容，但仍然无法正确解析它。

 "%exc.uns: 8 hours let @ = ABC, DEF", "exc_it = 1 day" , " summ=graffe ", " a,b,(c,d)"

新文本将在一个字符串中

 string mystr = @"""%exc.uns: 8 hours let @ = ABC, DEF"", ""exc_it = 1 day"" , "" summ=graffe "", "" a,b,(c,d)""";

 string str = "adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO"; var resultStrings = new List(); int? firstIndex = null; int scopeLevel = 0; for (int i = 0; i < str.Length; i++) { if (str[i] == ',' && scopeLevel == 0) { resultStrings.Add(str.Substring(firstIndex.GetValueOrDefault(), i - firstIndex.GetValueOrDefault())); firstIndex = i + 1; } else if (str[i] == '(') scopeLevel++; else if (str[i] == ')') scopeLevel--; } resultStrings.Add(str.Substring(firstIndex.GetValueOrDefault()));

事件更快：

 ([^,]*\x28[^\x29]*\x29|[^,]+)

这应该够了吧。基本上，寻找“function指纹”或没有逗号的任何东西。

 adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO ^ ^ ^ ^ ^

Carets象征着分组停止的位置。

只是这个正则表达式：

 [^,()]+(\([^()]*\))?

一个测试例子：

 var s= "adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO"; Regex regex = new Regex(@"[^,()]+(\([^()]*\))?"); var matches = regex.Matches(s) .Cast() .Select(m => m.Value);

回报

 adj_con(CL2,1,3,0) adj_cont(CL1,1,3,0) NG NG/CL 5 value of CL(JK) HO

如果您只是必须使用Regex，那么您可以拆分以下字符串：

 , # match a comma (?= # that is followed by (?: # either [^\(\)]* # no parens at all | # or (?: # [^\(\)]* # ... \( # ( [^\(\)]* # stuff in parens \) # ) [^\(\)]* # ... )+ # any number of times )$ # until the end of the string )

它将您的输入分解为以下内容：

 adj_con(CL2,1,3,0) adj_cont(CL1,1,3,0) NG NG/CL 5 value of CL(JK) HO

您还可以使用.NET的平衡分组构造来创建一个适用于嵌套parens的版本，但您可能还可以使用其中一个非Regex解决方案。

实现Snowbear正在做的事情的另一种方式：

  public static string[] SplitNest(this string s, char src, string nest, string trg) { int scope = 0; if (trg == null || nest == null) return null; if (trg.Length == 0 || nest.Length < 2) return null; if (trg.IndexOf(src) >= 0) return null; if (nest.IndexOf(src) >= 0) return null; for (int i = 0; i < s.Length; i++) { if (s[i] == src && scope == 0) { s = s.Remove(i, 1).Insert(i, trg); } else if (s[i] == nest[0]) scope++; else if (s[i] == nest[1]) scope--; } return s.Split(trg); }

我们的想法是将任何非嵌套分隔符替换为另一个分隔符，然后可以将其与普通string.Split()一起使用string.Split() 。你也可以选择使用什么类型的支架 - () ， <> ， [] ，甚至是像\/ ， ][或者`'这样奇怪的东西。为了您的目的，您将使用

 string str = "adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO"; string[] result = str.SplitNest(',',"()","~");

该函数首先将您的字符串转换为

 adj_con(CL2,1,3,0)~adj_cont(CL1,1,3,0)~NG~ NG/CL~ 5 value of CL(JK)~ HO

然后拆分~ ，忽略嵌套逗号。

假设非嵌套的匹配括号，您可以轻松匹配所需的标记，而不是分割字符串：

 MatchCollection matches = Regex.Matches(data, @"(?:[^(),]|\([^)]*\))+");

 var s = "adj_con(CL2,1,3,0),adj_cont(CL1,1,3,0),NG, NG/CL, 5 value of CL(JK), HO"; var result = string.Join(@"\n",Regex.Split(s, @"(?<=\)),|,\s"));

模式匹配）并从匹配中排除它然后匹配或匹配，后跟一个空格。

结果=

adj_con（CL2,1,3,0）
adj_cont（CL1,1,3,0）
NG
NG / CL
5的CL值（JK）
HO

TextFieldParser（ msdn ）类似乎具有内置function：

TextFieldParser类： – 提供用于解析结构化文本文件的方法和属性。

使用TextFieldParser解析文本文件类似于迭代文本文件，而提取文本字段的ReadFields方法类似于拆分字符串。

TextFieldParser可以解析两种类型的文件：分隔文件或固定宽度。某些属性（如Delimiters和HasFieldsEnclosedInQuotes）仅在使用分隔文件时才有意义，而FieldWidths属性仅在使用固定宽度文件时才有意义。

看到帮助我找到它的文章

这是一个更强大的选项，它解析整个文本，包括嵌套括号：

 string pattern = @" \A (?> (? (?: [^,()] # Regular character | (? \( ) # Opening paren - push to stack | (?<-Paren> \) ) # Closing paren - pop | (?(Paren),) # If inside parentheses, match comma. )*? ) (?(Paren)(?!)) # If we are not inside parentheses, (?:,|\Z) # match a comma or the end )*? # lazy just to avoid an extra empty match at the end, # though it removes a last empty token. \Z "; Match match = Regex.Match(data, pattern, RegexOptions.IgnorePatternWhitespace);

您可以通过迭代match.Groups["Token"].Captures获得所有匹配match.Groups["Token"].Captures 。

当字段中存在逗号和括号时，如何解析逗号分隔的字符串

根据用户确定要在Json.Net中序列化的属性

protobuf-net：序列化一个空列表

为什么WinForms应用程序中的Application.Current == null？

有没有办法强制C＃类实现某些静态函数？

C＃ – ADO.NET的一些高性能最佳实践/技巧是什么？

如何使用intellisense支持编写类似string.Format的方法

BackgroundWorkerexception处理

套接字编程有哪些替代方案？

如何在ac＃应用程序中对Web服务的两次调用之间保持会话活动？

将JSON递归反序列化为IDictionary