汉字存储使用
1. 汉字在电脑中如何存储的
1.每个英文字符对应一个字节----这就是ASCII码,如31-Ƈ',41-'A',ཹ'-'a'.美国人定的标准.x0dx0a2.汉字采用2字节桐枝编码(现在不完全准确),国家制定.现在的标准是GB18030,早期是GB2312-80.前者含盖后者.x0dx0a3.一个字节是8位,ASCII码最高位是Ɔ'(所以最多128个编码).x0dx0a4.汉字将最高位置为Ƈ',与ASCII码(英文符号)区隔开.x0dx0a5.软件当读取一个字节时,先判断最高位是否为Ɔ'.若是,则作英文符号处理;若不是,再读取下一个字节,两个字节合一处对应一个汉字.如,B0A1-'啊',D5FE-'政'.x0dx0a6.无论是ASCII码还是汉字编码,相当于身份证号.实际显示出的配老汉字要到一个叫"汉字模库'的文件中提取,它的位置与编码有局卖敏相对应的关系.
2. 汉字数字化存储必须使用格式处理的方式
采用Unicode编码Unicode是一种国际标准的字符编码,可以将汉字转换为统一的编码,从而使汉字能够跨平台存储和传输。
1、采用GBK/GB2312编码GBK/GB2312是汉字编码的国家标准,它可以将汉字进行编码,从而使汉字能够在中文系统中存储和传输。则银
2、采用GB18030编码山搏GB18030是一种汉字编码,它支持更多的汉字,可以支持更多语种,从而使汉字能够在多种语言环境中存储和传输。
3、采用UTF-8编码UTF-8是一种Unicode的编码,它可逗盯祥以支持多种语言,从而使汉字可以在多种语言环境中存储和传输。
3. 汉字数字化存储必须使用矩阵处理的方式
用点阵矩阵的方颤型式存储的。
汉字字形的存储是用点阵矩阵的方式存储的,假设48X48点的汉字字形,表示水平方向上有48个点,垂直方向上也有衫含48个点,这样总共的点数是48X48=2304个点,每个点用1个二进制位茄塌猜表示,则2304个点需要用2304÷8=288个字节。
汉字数字分好几种,阿拉伯数字是最普遍的一种。阿拉伯数字并不是阿拉伯人发明的而是印度人发明的,实际应该列为印度语言,只是先传播到阿拉伯,然后传向世界的,所以称之为“阿拉伯数字”。
4. 计算机对汉字进行处理和存储时使用汉字的
机内码。在计算机中,对汉字进行传输、处理和存储时使用汉字的机内码。GB2312-80是我国第一个汉字编码国标,其中规定一个汉字占两个扮扮知字节,即16bit。国标码使每个汉字都有了唯一对应的码。
在计算机中,对汉字进行传厅消输、处理和存储时使用汉字的机内码。GB2312-80是我国第一个汉字编码国标,其中规定一个汉字占两个字节,即16bit。国标码使每个汉字都有了唯一对应的码,但在计算机内国标码会与ASCII码冲突,所以将国标码每个字节加128避开了ASCII,成为了汉字传输、处理和存储时使用的机内码。缺销字形码存储的是汉字的点阵图,用于显示或打印汉字时使用汉字。