Tag:

将句子分成单词,但在C#中标点符号有问题

我已经看到了一些类似的问题,但我正在努力实现这一目标。 给定一个字符串,str =“月亮是我们的天然卫星,即它围绕地球旋转!” 我想提取单词并将它们存储在一个数组中。 预期的数组元素就是这样。 the moon is our natural satellite ie it rotates around the earth 我尝试使用String.split(’,’\ t’,’\ r’),但这不能正常工作。 我也尝试删除。和其他标点符号,但我想要一个像“ie”这样的字符串也要解析出来。 实现这一目标的最佳方法是什么? 我也尝试使用regex.split无济于事。 string[] words = Regex.Split(line, @”\W+”); 肯定会欣赏正确方向的一些推动。