查ASC码/汉字的编码知识

查ASC码相关知识 - 汉字的编码知识


  信息编码各国有各国不同的编码,国际上统一使用的编码为ASCII(美国标准信息交换代码),我国使用的有国标码BG(中文),和BIG5(中文繁体)两种。

  1.汉字的编码


  (1)国标码:是指我国1980年公布的“信息交换汉字编码字符集”,代号为“GB2312-80”。由连续的两个字节组成。


  (2)机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。


  (3)输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。


  (4)字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。


  编码的转换举例   汉字 区位码 16进制  国标码  机内码   文  4636  2E24H  4E44H   CEC4H


  “文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100转换成国标码“4E44H”,0100 1110 0100 0100机内码为“CEC4H”, 1100 1110 1100 0100


  2.汉字的输入方法


  汉字输入方法目前有两大类四种。


  (1)键盘输入法。这是最常用的,利用各种汉字输入方法的编码敲击键盘来输入汉字;


  (2)非键盘输入法。目前主要有三种方法。  


  手写笔输入法:利用汉字识别技术,通过书写笔在感应板上书写汉字把其输入的方法。


  语音输入法:利用语音识别技术,通过口说来输入汉字。


  扫描识别输入,是将印或写在纸上的汉字通过扫描仪输入计算机,再经相应软件处理后转换成汉字机内码。


  3.汉字字符集的概念


  有两种汉字字符集。


  (1)国标码字符集GB2312-80:该字符集收录了6763个常用汉字,其中一级汉字3755个,二级汉字3008个。另外还收录了各种符号682个,合计7445个。


  (2)GBK汉字集:GBK即汉字扩充内码规范,又称大字符集,一共收录了20900个汉字。在Windows简体中文版中,又增加了101个补充字,一共有21001个字。它包容了GB2312-80的6763个常用汉字,台湾BIG5码收录了13000多个汉字,是目前见到的收录汉字最多的汉字系统。


关于“查ASC码/汉字的编码知识”的留言:

目前暂无留言

新增相关留言