Bootstrap

29.UTF-8与ASCII C#例子

UTF-8(Universal Character Set/Unicode Transformation Format)

是一种Unicode

Unicode的编码方式有三种:UTF-8、UTF-16UTF-32

支持Unicode标准中的所有字符,目前Unicode标准已包含超过140,000个字符。

  • 使用可变长度的字节来表示字符,范围从1到4个字节。
  • 英文字符(如A-Z,a-z,0-9)使用1个字节(与ASCII编码相同)。
  • 欧洲语言中的重音字符和其他符号通常使用2个字节。
  • 其他语言的字符(如汉字、日文汉字)使用3或4个字节。

可以只使用1个字节。

ASCII美国标准信息交换代码(American Standard Code for Information Interchange)的缩写,为美国英语通信所设计。它由128个字符组成,包括大小写字母、数字0-9、标点符号、非打印字符(换行符制表符等4个)以及控制字符(退格、响铃等)组成。

每个字符使用7位二进制数表示(但在实际存储和传输中通常使用8位,最高位为0)。

只使用一个字节表示一个字符

UTF-8的第一个字节就和ASCIi一致,这使得它兼容ASCIi编码

​​​​​​​

;