GBK 概念 建立在 GB2312 的基础上 向下兼容 GB2312 GB2312 编码的字符和二进制表示,在 GBK 编码里是完全一样的 同样使用固定的两个字节表示 字节范围 高位字节:0x81~0xFE 低位字节:0x40-0x7E 或 0x80~0xFE 低位字节可以从 0x40 开始,最高位可能为 0 判断汉字还是 ASCII 字符的方法: 解析二进制流时,如果第一个字节的最高位为 1 将下一个字节读进来一起解析为一个汉字 解析完后,跳到第三个字节继续解析 关联文章 非Unicode编码