在字符串中定义4字节UTF-16字符

我读过一个关于UTF-8，UTF-16和UCS-2的问题，几乎所有答案都说明UCS-2已经过时，C＃使用UTF-16。

但是，我在C＃中创建4字节字符U + 1D11E的所有尝试都失败了，所以我实际上认为C＃仅使用UTF-16的UCS-2子集。

有我的尝试：

string s = "\u1D11E"; // gives the 2 character string "ᴑE", because \u1D11 is ᴑ string s = (char) 0x1D11E; // won't compile because of an overflow string s = Encoding.Unicode.GetString(new byte[] {0xD8, 0x34, 0xDD, 0x1E}); // gives 㓘ờ

C＃字符串真的是UTF-16还是它们实际上是UCS-2？如果它们是UTF-16，我怎样才能将小提琴谱号放入我的C＃弦中？

使用大写U代替：

  string s = "\U0001D11E";

你忽略了大多数机器是小端的：

  string t = Encoding.Unicode.GetString(new byte[] { 0x34, 0xD8, 0x1E, 0xDD });

C＃绝对使用UTF-16。定义U + 0000 – U + FFFF范围之上的字符的正确方法是使用允许使用8个hex数字定义字符的转义序列：

 string s = "\U0001D11E";

如果使用\u1D11E其解释为U+1D11字符，后跟E

使用这些字符时要记住的一件事是String.Length属性和大多数字符串方法适用于UTF-16代码单元，而不是Unicode字符。从MSDN文档：

Length属性返回此实例中Char对象的数量，而不是Unicode字符数。原因是Unicode字符可能由多个Char表示。使用System.Globalization.StringInfo类来处理每个Unicode字符而不是每个Char。

根据C＃规范，使用\U （大写U）和8个hex字符编码超过4个hex字符长度的字符。一旦在字符串中正确编码，就可以使用任何unicode编码正确导出;

 string s = "\U0001D11E"; foreach (var b in Encoding.UTF32.GetBytes(s)) Console.WriteLine(b.ToString("x2")); Console.WriteLine(); foreach (var b in Encoding.Unicode.GetBytes(s)) Console.WriteLine(b.ToString("x2")); > 1e > d1 > 01 > 00 > > 34 > d8 > 1e > dd

在字符串中定义4字节UTF-16字符

C＃取一个字符串的子串

以编程方式移动鼠标光标

NHibernate CreateSQLQuery

ISerializable是否与具有较少字段的以前版本的类向后兼容？

无法加载文件或程序集’Oracle.DataAccess错误

分离两个base64字符串的最佳方法

ASP.NET MVC自定义成员资格提供程序 – 如何重载CreateUser？

从任务中的异步HttpWebRequest调用捕获exception

在.NET中简单混淆字符串？

非对称加密和解密