如何从C＃中的字符串中删除非ASCII字

我想过滤一些有一些错误字母的字符串（非ASCII ）。它在Notepad，Visual Studio 2010和MySQL中看起来有所不同。

如何检查字符串是否包含非ASCII字母以及如何删除它们？

您可以使用正则表达式过滤非ASCII字符：

string input = "AB £ CD"; string result = Regex.Replace(input, "[^\x0d\x0a\x20-\x7e\t]", "");

您可以使用正则表达式。

 Regex.Replace(input, "[^a-zA-Z0-9]+", "")

您还可以使用\W+作为模式来删除任何非字符。

首先，您需要确定“单词”的含义。如果不是ascii，这可能意味着非英语？

就个人而言，我会问你为什么需要这样做以及你的应用程序与数据冲突的基本假设是什么？根据具体情况，我建议您重新编码来自源编码的文本，尽管这将是一个有损转换，或者，可以解决这个基本假设，以便您的应用程序正确处理数据。

这是一个神派：

 Regex.Replace(input, @"[^\u0000-\u007F]", "");

我想我最初在其他地方得到了它，但这里是相同答案的链接：

如何从字符串中删除非ASCII字符？（在C＃中）

我觉得这个简单的东西可能会起作用，不是吗？

 public static string AsciiOnly(this string input, bool includeExtendedAscii) { int upperLimit = includeExtendedAscii ? 255 : 127; char[] asciiChars = input.Where(c => (int)c <= upperLimit).ToArray(); return new string(asciiChars); }

用法示例：

 string input = "AB£ȼCD"; string asciiOnly = input.AsciiOnly(false); // returns "ABCD" string extendedAsciiOnly = input.AsciiOnly(true); // returns "AB£CD"

如何从C＃中的字符串中删除非ASCII字

必须声明标量变量“@UserName”

如何编写在C＃中实现给定接口的通用容器类？

C＃：用于文本文件的尾部程序

ListView ColumnHeader.Name是空字符串

Lambda属性值选择器作为参数

从词典中组合“检查添加或提取”

什么是sql连接字符串中“最大池大小”的最大允许值

如何使用样式（remix）更改MahApps.Metro对话框内容

在IIS 7.5中部署WCF服务

“对PInvoke函数的调用使堆栈失衡”