汉字存储和处理
⑴ 计算机对汉字进行处理和存储时使用汉字的什么码
一般都是ASCII或者Unicode比较多,如果是字库量非常少的有可能只用区位码,就像以往的高考报名。
⑵ 在计算机内部,对汉字进行传输、处理和存储时使用的是汉字的()
在电脑内部对汉字进行传输处理和存储时使用汉字的机内码。
电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。
输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。
国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的毁含国标码为8680(十进制)或7468(十六进制)。
内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区数悉别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。
字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′24=72个字节。计算公纤毕笑式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。
⑶ 什么编码用于汉字的存取、处理和传输
汉字机内码用于汉字的存取、处理和传输。
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。
机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。
(3)汉字存储和处理扩展阅读:
内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。
英文ASCII字符采用一个字节的内码表示,中文字符如国标字符集中,GB2312、GB12345、GB13000皆用双字节内码。
GB18030(27,533汉字)双字节内码汉字为20,902个,其余6,631个汉字用四字节内码。
⑷ 汉字数字化存储必须使用格式处理的方式
采用Unicode编码Unicode是一种国际标准的字符编码,可以将汉字转换为统一的编码,从而使汉字能够跨平台存储和传输。
1、采用GBK/GB2312编码GBK/GB2312是汉字编码的国家标准,它可以将汉字进行编码,从而使汉字能够在中文系统中存储和传输。则银
2、采用GB18030编码山搏GB18030是一种汉字编码,它支持更多的汉字,可以支持更多语种,从而使汉字能够在多种语言环境中存储和传输。
3、采用UTF-8编码UTF-8是一种Unicode的编码,它可逗盯祥以支持多种语言,从而使汉字可以在多种语言环境中存储和传输。