记事本的编码问题,当文档中所有字符都在 C0≤AA≤DF 80≤BB≤BF 这个范围的时候,notepad都无法确认文档的格式,没有自动按照UTF-8格式来"Display"。 "联通"就是C1 AA CD A8,刚好在上面的范围内,所以不能正常显示。
但是由于不够详细,笔者就这一问题又特地咨询了放飞技术网的高翅工程师,高工非常热心的给我们带来了更加
例如在GB-2312字符集中,“联通”的编码为C1 AC CD A8,其中C1和CD就是Leading Byte。前127个编码为标准ASCII保留,例如“0”的编码是30H(30H表示十六进制的30)。软件在读取时,如果看到30H,知道它小于128就是标准ASCII,表示“0”,看到C1大于128就知道它后面有一个另外的编码,因此C1 AC一同构成一个整个的编码,在GB-2312字符集中表示“连”。