汉字存储
1. 一个汉字所占的存储空间为多少字节
一个中文汉字占两个字节的空间,一个汉字中的标点也是两个字节。
计算机信息技术用于计量存储容量的一种计量单位,通常情况下一字节等于八位,也在一些计算机编程语言中表示数据类型和语言字符。
一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。
(1)汉字存储扩展阅读:
数据存储是以“字节”(Byte)为单位,数据传输大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。
B与iB:
1KiB(Kibibyte)=1024byte
1KB(Kilobyte)=1000byte
1MiB(Mebibyte)=1048576byte
1MB(Megabyte)=1000000byte
2. 汉字字模存储汉字,每个汉字需多少字节,存储容量是多少
16×16点阵表示一个汉字,字形码需用32字节,
即:字节数=点阵行数×点阵列数/8
(16×16/8)×3755/1024=117.34375KB
用24×24点阵来表示一个汉字
(24×24/8)×8836/1024=39762KB
1MB=1024KB,转换成MB就不用我再算了吧!呵呵~~~~~要加分哦~
3. 汉字信息在计算机中通常是以______形式存储的
计算机内部用于汉字信息的存储、运算的信息代码称为汉字内码。
汉字内码指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。
(3)汉字存储扩展阅读:
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1。
即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
4. 1K个字节大约可以存储多少个汉字
可以存512个汉字官方标准: 1汉字=2字节 1字节(Byte)=8字位=8个二进制数 1字位(bit)=1个二进制数 1B=8b 1KB=1024B 1MB=1024KB
5. 1字节可以存放几个汉字
在一些计算机系统中,4 个字节代表一个字。
字节是二进制数据的单位。一个字节通常8位长。但是,一些老型号计算机结构使用不同的长度。为了避免混乱,在大多数国际文献中,使用词代替byte。在多数的计算机系统中,一个字节是一个8位长的数据单位,大多数的计算机用一个字节表示一个字符、数字或其他字符。
一个字节也可以表示一系列二进制位。一些语言描述需要2个字节表示一个字符,这叫做双字节字符集。一些处理器能够处理双字节或单字节指令。字节通常简写为“B”,而位通常简写为小写“b”,计算机存储器的大小通常用字节来表示。
(5)汉字存储扩展阅读:
字节的换算:
1、ASCII码:一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制 ,最小值-128,最大值127。如一个ASCII码就是一个字节。
2、UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节。
3、Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节。
6. 存储120个64*64点阵的汉字,需要占存储空间多少KB
15360字节。
点阵汉字可以形象的理解为一个方形矩阵,一个32×32点阵汉字共有32×32个点。
每个点是否显示可以用字节中的bit是1或0来表示,1个字节有8位(bit),标识汉字每行上的32个点需要用32÷8bit=4字节,1个汉字有32行,则一共占用32×4byte=128字节。
所以存储120个64*64点阵的汉字,需要120×128bytes=15360字节。
15360bytes÷1024=15kbytes。
所谓一个字的点阵. 其实就是指这个汉字用多少个象素点来描述。每个象素点显示为什么颜色, 通常情况下, HZK16采用的是16*16点阵, 即256个象素点描述一个汉字。
这些点的颜色分为两种,一种是前景色,一种是显示为背景色。
可以这样来考虑, 在纸上比较正正方方的写一个规则的楷字, 然后在这个字的从上到下,左到右, 分别画十七条直线, 那么这个字就被放置于一个16*16的方格之内, 这样就可以很明显的看出, 16*16的方格内的具体哪些点有笔划经过。
有笔划经过与没笔化经过的即就是应该被分别填充上前景色与背景色的点.现在,找到了一个汉字的点阵, 那么还须要用数据来记录点阵的信息, 通常情况下, 会用32个字节来表示16*16点阵的汉字。
即每一行用二个字节来记录十六个象素点的色色彩情况, 0表示背景色, 1表示前景色。
16行其须要32个字节。点阵汉字的原理同时也决定了它的缺点,他不具务放大特性,因为它的显示是基于被定死的点阵,放大后,会产生明显的锯齿,非常的难看,当然,可以进行一些光滑处理,但基本上没有多在的改观。
但点阵汉字简易, 对于复杂汉字, 它比矢量显示汉字法更快带.矢量显示是基于记录汉字的笔化的. 对于简单的汉字它比较占优势, 容易放大处理. 但对于复杂的汉字, 表示起来, 则笔化太多复杂。
(6)汉字存储扩展阅读:
点阵字库常用来作为显示字库使用,这类点阵字库汉字最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。
矢量字库保存的是对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在显示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可以被无限地放大,笔划轮廓仍然能保持圆滑,打印时使用的字库均为此类字库。
Windows使用的字库也为以上两类,在FONTS目录下,如果字体扩展名为FON,表示该文件为点阵字库,扩展名为TTF则表示矢量字库。
7. 汉字在电脑中如何存储的
1.每个英文字符对应一个字节----这就是ASCII码,如31-'1',41-'A','61'-'a'.美国人定的标准.
2.汉字采用2字节编码(现在不完全准确),国家制定.现在的标准是GB18030,早期是GB2312-80.前者含盖后者.
3.一个字节是8位,ASCII码最高位是'0'(所以最多128个编码).
4.汉字将最高位置为'1',与ASCII码(英文符号)区隔开.
5.软件当读取一个字节时,先判断最高位是否为'0'.若是,则作英文符号处理;若不是,再读取下一个字节,两个字节合一处对应一个汉字.如,B0A1-'啊',D5FE-'政'.
6.无论是ASCII码还是汉字编码,相当于身份证号.实际显示出的汉字要到一个叫"汉字模库'的文件中提取,它的位置与编码有相对应的关系.
8. 计算机中存储一个汉字需要几字节
一个汉字需要两个字节,英文则只需要一个字节。
ASCII码:一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制 ,最小值-128,最大值127。如一个ASCII码就是一个字节。
UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节。
(8)汉字存储扩展阅读:
易混概念辨析
(1)字
在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。字通常分为若干个字节(每个字节一般是8位)。在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。字的长度用位数来表示。
在计算机的运算器、控制器中,通常都是以字为单位进行传送的。字出现在不同的地址其含义是不相同。例如,送往控制器去的字是指令,而送往运算器去的字就是一个数。
(2)字长
计算机的每个字所包含的位数称为字长。根据计算机的不同,字长有固定的和可变的两种。固定字长,即字长度不论什么情况都是固定不变的;可变字长,则在一定范围内,其长度是可变的。
计算的字长是指它一次可处理的二进制数字的数目。计算机处理数据的速率,自然和它一次能加工的位数以及进行运算的快慢有关。如果一台计算机的字长是另一台计算机的两倍,即使两台计算机的速度相同,在相同的时间内,前者能做的工作是后者的两倍。
一般地,大型计算机的字长为32-64位,小型计算机为12-32位,而微型计算机为4-16位。字长是衡量计算机性能的一个重要因素。
9. 为什么存储一个汉字需2字节
1.44乘以1024的平方再除以2,应该是754974.72个汉字,约754974个汉字。