位置:51电子网 » 技术资料 » IC/元器件

汉字交换码

发布时间:2014/6/1 21:51:01 访问次数:4765

   同西文字符在计算机中要用ASCII码存储一样,汉字在计算机中也以二进制的形式存储,AB2000/TWL93004C但由于汉字的结构与西文不同,而且数量众多,其编码方式相对要复杂一些。

   1.汉字交换码

   为了在信息交换中有通用的规则,我国于1981年颁布了《信息交换用汉字编码字符GB2312-80,简称国标码。在该标准中,每个汉字的编码由16位二进制数表示,占两个字节,每个字节按照标准ASCII码的规则编码。国标码是重要的汉字交换码,是汉字在计算机中存储的基础。但是,如果将汉字和西文字符混合存储,就会出现混淆。原因在于,对某一个字节,计算机难以判断该字节是汉字的第一个字节,还是一个西文字符的ASCII码。因此,国标码不能直接用于汉字的存储,必须进行转换。以汉字“万”

   为例,其国标码是4D72H,转换为二进制表示是0100 1101 0111 0010。显然,二进制串01001101可以看成是字母。M,的ASCII码值,而二进制串0111 0010可以看成是字母‘r’的ASCII码值。也就是说,计算机既可以把4D72H解释成汉字“万”,也可以解释成两个英文

   字母rMr,。,出现二义性问题是不允许的。汉字机内码就是在国标码的基础上,经过简单转换得到的。

   2.汉字机内码

   为了避免出现国标码和ASCII码之间的冲突问题,研究人员对汉字国标码进行了如下转换:将汉字国标码每一个字节的最高位变为l。仍以汉字“万”为例,最高位转变后,汉字编码变为1100 1101 1111 0010。这样就解决了汉字编码同ASCII码的冲突间题。以上 转变可认为是在国标码的基础之上增加8080H,就得到了汉字机内码,即:

   汉字国标码+ 8080H=汉字机内码


   同西文字符在计算机中要用ASCII码存储一样,汉字在计算机中也以二进制的形式存储,AB2000/TWL93004C但由于汉字的结构与西文不同,而且数量众多,其编码方式相对要复杂一些。

   1.汉字交换码

   为了在信息交换中有通用的规则,我国于1981年颁布了《信息交换用汉字编码字符GB2312-80,简称国标码。在该标准中,每个汉字的编码由16位二进制数表示,占两个字节,每个字节按照标准ASCII码的规则编码。国标码是重要的汉字交换码,是汉字在计算机中存储的基础。但是,如果将汉字和西文字符混合存储,就会出现混淆。原因在于,对某一个字节,计算机难以判断该字节是汉字的第一个字节,还是一个西文字符的ASCII码。因此,国标码不能直接用于汉字的存储,必须进行转换。以汉字“万”

   为例,其国标码是4D72H,转换为二进制表示是0100 1101 0111 0010。显然,二进制串01001101可以看成是字母。M,的ASCII码值,而二进制串0111 0010可以看成是字母‘r’的ASCII码值。也就是说,计算机既可以把4D72H解释成汉字“万”,也可以解释成两个英文

   字母rMr,。,出现二义性问题是不允许的。汉字机内码就是在国标码的基础上,经过简单转换得到的。

   2.汉字机内码

   为了避免出现国标码和ASCII码之间的冲突问题,研究人员对汉字国标码进行了如下转换:将汉字国标码每一个字节的最高位变为l。仍以汉字“万”为例,最高位转变后,汉字编码变为1100 1101 1111 0010。这样就解决了汉字编码同ASCII码的冲突间题。以上 转变可认为是在国标码的基础之上增加8080H,就得到了汉字机内码,即:

   汉字国标码+ 8080H=汉字机内码


上一篇:ASCII码

上一篇:其他编码

相关技术资料
6-1汉字交换码
相关IC型号
AB2000/TWL93004C
AB206

热门点击

 

推荐技术资料

单片机版光立方的制作
    N视频: http://v.youku.comN_sh... [详细]
版权所有:51dzw.COM
深圳服务热线:13692101218  13751165337
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式