「GB2312」- 信息交换用汉字编码字符集 | GB/T 2312-1980

认识

https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=5664A728BD9D523DE3B99BC37AC7A2CC

《信息交换用汉字编码字符集》是由中国国家标准总局于 1980 年发布的国家标准(GB/T 2312-1980),1981 年 5 月 1 日正式实施,2017 年 3 月 23 日转为推荐性标准。该标准包含 6763 个汉字(其中一级 3755 个按拼音排序,二级 3008 个按部首排序)和 682 个非汉字字符(含拉丁字母、日文假名等),采用 94 区×94 位的分区结构,通过区位码转换生成国标码和机内码,适用于汉字处理及通信系统的信息交换,通行于中国大陆,新加坡等地也采用此编码。

组成

GB2312 简体中文编码表

GB2312 标准共收录 6763 个汉字,其中一级汉字 3755 个,二级汉字 3008 个;同时,GB 2312 收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的 682 个全角字符。整个字符集分成 94 个区,每区有 94 个位。

GB2312,又称为 GB0,由中国国家标准总局发布,1981 年 5 月 1 日实施

GB2312 标准共收录 6763 个汉字,其中一级汉字 3755 个,二级汉字 3008 个

GB2312 是一种区位码。分为 94 个区(01-94),每区 94 个字符(01-94)

01-09 区为特殊符号

10-15 区没有编码

16-55 区为一级汉字,按拼音排序,共 3755 个

56-87 区为二级汉字,按部首/笔画排序,共 3008 个

88-94 区没有编码

GB2312 只是编码表,在计算机中通常都是用”EUC-CN”表示法,即在每个区位加上 0xA0 来表示。区和位分别占用一个字节。

WIP GB2312 汉字编码字符集对照表

WIP