主页 > 电脑教程 >

电脑 字符编码详解

电脑教程 2016-06-24

一、字符编码

计算机处理能处理数字数据外,还可以处理字符数据。字符数据包括字母、各种控制符号、图形符号等,各种数据在计算机中都是以二进制形式表示的,而这些数据在处理前必须经过编码才能输入到计算机中。

二、asciii码

Ascll码是“美国标准信息交换码”的简称,是计算机上使用最多、最普遍的字符编码。Ascll码常用于输入/输出设备,如键盘输入及屏幕显示、电传打字机、打印机等。当使用键盘输入字符时,编码电路将字符ascll码输入计算机,计算机处理后输出ascll码,由设备转换为字符后显示或打印出来。

三、汉字编码字符集

1.信息交换用汉字编码字符集(gb2312-1980)

信息交换用汉字编码字符集是中华人民共和国国家汉子信息交换用编码,由国家标准总局于1981年发布实施。Gb2312给出一个二维代码表,表中有94行、94列,共收集了简化汉字即符号、字母、日文假名等共7 445个图形字符,其中汉字占6 763个。这些汉字的代码可以用代码表上的字所处的行号和列好来表示,行号称为区号、列号称为位号。目前国家已有新标准gb18030-2000,该标准收录了共27 484个汉字。

2.区位码

区位码是编码的另一种表示形式,即用两位十进制数直接表示字符的区号和位号,区号和位号都是01~94.

3.国标码

国标码是“国家标准信息交换用汉字编码的简称”,是机器内部使用的汉字编码。国标码的编码方法较为简单,共分为94个区,每个区94位,共有8 836个编码,1~15区为字母/数字、符号;16~49区为汉字。由于6 763个汉字加700多个符号用不完这些编码,所以10~15区是空的,88区以后也是空的。汉字国标码要用两个字节表示,区编号为第一字节,位编号为第二字节。每个字节用两个十六进制数表示,而西文字母只需一个字节表示。为保护中、西兼容,国标码必须能区分西文和汉字,因此,国标码的区号和位号都是从a1~fe,而ascii编码是从21~7e,21前面是ascii码的控制符号。当输入字符时,计算机根据第一个字符就能判断输入的是国标码还是ascii码。

四、汉字编码

汉字是一种字符,但比英文字符复杂且量大。因此,在计算机上处理汉字要解决汉字输入、输出及计算机内部的编码问题。根据文字处理过程中不同的要求,有多种编码,主要分为汉字交换码、汉字输入码、汉字内码和汉字字形码四类。

1.汉字交换码

汉字交换码是汉字系统或通讯系统间在交换信息时,对每一个汉字所规定的统一编码。我国已制定了汉字交换码的国家标准《信息交换用汉字编码字符集》代号为gb 2312-80 又成为国际码。国标码字符集共收入汉字和图形符号好7 445个。

2.汉字输入码

指直接从键盘输入的各种汉字输入方法的编码。汉字输入编码的研究和发展十分迅速,已有几百种汉字输入编码方案,各种输入编码大致可以分为:数字编码、字音编码、自行编码和音形编码。

3.汉字内码

汉字内码在设备和汉字处理系统内部存储、处理、传输汉字使用的编码


标签: 字符编码

电脑软硬件教程网 Copyright © 2016-2030 www.computer26.com. Some Rights Reserved.