Tag: tokenize

解析空格分隔文本的最佳方法

我有这样的字符串 /c SomeText\MoreText “Some Text\More Text\Lol” SomeText 我想对它进行标记,但是我不能只是在空格上分开。 我想出了一个有点丑陋的解析器,但是我想知道是否有人有更优雅的设计。 这是在C#btw中。 编辑:我的丑陋版本,虽然丑陋,是O(N),实际上可能比使用RegEx更快。 private string[] tokenize(string input) { string[] tokens = input.Split(‘ ‘); List output = new List(); for (int i = 0; i < tokens.Length; i++) { if (tokens[i].StartsWith("\"")) { string temp = tokens[i]; int k = 0; for (k = i + 1; k < […]

C ++中的字符串标记生成器,允许多个分隔符

有没有办法在C ++中用多个分隔符标记字符串? 在C#中我会做到: string[] tokens = “adsl, dkks; dk”.Split(new [] { “,”, ” “, “;” }, StringSplitOptions.RemoveEmpty);

超级大国:仅当字符串开始一行时才匹配字符串

在超级大国中解析时,如果只是一个字符串中的第一个字符串,如何匹配字符串? 例如,我需要在“A:Hello Goodbye \ n”中匹配A冒号,而不是在“Goodbye A:Hello \ n”中匹配