Bootstrap

字符编码之ASCII、GB2312、GBK、GB18030、UNICODE、UTF-8、UTF-16、UTF-32、ANSI初步理解

在理解字符编码之前,先做好准备工作:

  • 工具:UltraEdit,windows自带文本编辑器。
  • 约定:GBK代表GB2312,GBK,GB18030

首先在UltraEdit输入一串文字分别保存为不同编码格式查看其16进制。

  • 输入内容:12Aa练习
  • 结果:如 图1
图1
编码格式 GBK ANSI UNICODE
16进制值     31 32 41 61 C1B7 CFB0    31 32 41 61 C1B7 CFB0          31 32 41 61 7EC3  4E60          
编码格式        UTF-8 UTF-16LE UTF-16BE
16进制值 31 32 41 61 E7BB83 E4B9A0 3100 3200 4100 6100 C37E 604E 0031 0032 0041 0061 7EC3  4E60

注:输入内容中的6个字符和图1中每种编码下空格隔开的16进制一一对应

从上图得出

;