如何在C#中替换字符串中的文本?
我有这段特殊的代码,但它不起作用。
text = text.Replace("\xEF\xBF\xBD", "?");
有没有人知道如何将文本"\xEF\xBF\xBD"
替换为"?"
在C# String
。
简短回答(猜一点):
text = text.Replace("\xFFFD", "?");
并了解Unicode和字符编码 ,尤其是utf-8。
答案很长:
嗯,你的意思是“\ xEF \ xBF \ xBD”吗? 也就是说,由这些字符组成的字符串:
backslash, uppercase latin character E, uppercase latin character F, backslash, uppercase latin character B, uppercase latin character F, backslash, uppercase latin character B, uppercase latin character D
然后,答案是:
text = text.Replace(@"\xEF\xBF\xBD", "?");
或者你是由C#转义序列“\ xEF \ xBF \ xBD”描述的字符序列,即:
LATIN SMALL LETTER I WITH DIAERESIS, INVERTED QUESTION MARK, VULGAR FRACTION ONE HALF
(显示为“�”)然后,你的代码是正确的:
text = text.Replace("\xEF\xBF\xBD", "?");
或者您想要替换字节序列
EF BF BD
(实际上可能是unicode替换字符的utf-8表示,FFFD,通常显示为“ ”)?
这只是一个疯狂的猜测,但凭直觉说你实际上想要实现后者。 现在,.Net字符串包含字符,而不是字节,但假设您已经读取了这些字节,例如从文件中读取为utf-8,答案是:
text = text.Replace("\xFFFD", "?");
你必须逃避反斜杠。
text = text.Replace("\\xEF\\xBF\\xBD", "?");
或者,您可以使用@符号转义整个字符串:
text = text.Replace(@"\xEF\xBF\xBD", "?");