漢字存儲
1. 一個漢字所佔的存儲空間為多少位元組
一個中文漢字占兩個位元組的空間,一個漢字中的標點也是兩個位元組。
計算機信息技術用於計量存儲容量的一種計量單位,通常情況下一位元組等於八位,也在一些計算機編程語言中表示數據類型和語言字元。
一個英文字母(不分大小寫)佔一個位元組的空間。一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數。換算為十進制,最小值-128,最大值127。如一個ASCII碼就是一個位元組。
(1)漢字存儲擴展閱讀:
數據存儲是以「位元組」(Byte)為單位,數據傳輸大多是以「位」(bit,又名「比特」)為單位,一個位就代表一個0或1(即二進制),每8個位(bit,簡寫為b)組成一個位元組(Byte,簡寫為B),是最小一級的信息單位。
B與iB:
1KiB(Kibibyte)=1024byte
1KB(Kilobyte)=1000byte
1MiB(Mebibyte)=1048576byte
1MB(Megabyte)=1000000byte
2. 漢字字模存儲漢字,每個漢字需多少位元組,存儲容量是多少
16×16點陣表示一個漢字,字形碼需用32位元組,
即:位元組數=點陣行數×點陣列數/8
(16×16/8)×3755/1024=117.34375KB
用24×24點陣來表示一個漢字
(24×24/8)×8836/1024=39762KB
1MB=1024KB,轉換成MB就不用我再算了吧!呵呵~~~~~要加分哦~
3. 漢字信息在計算機中通常是以______形式存儲的
計算機內部用於漢字信息的存儲、運算的信息代碼稱為漢字內碼。
漢字內碼指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。
(3)漢字存儲擴展閱讀:
漢字機內碼、國標碼和區位碼三者之間的關系為:區位碼(十進制)的兩個位元組分別轉換為十六進制後加2020H得到對應的國標碼;機內碼是漢字交換碼(國標碼)兩個位元組的最高位分別加1。
即漢字交換碼(國標碼)的兩個位元組分別加80H得到對應的機內碼;區位碼(十進制)的兩個位元組分別轉換為十六進制後加A0H得到對應的機內碼。
4. 1K個位元組大約可以存儲多少個漢字
可以存512個漢字官方標准: 1漢字=2位元組 1位元組(Byte)=8字位=8個二進制數 1字位(bit)=1個二進制數 1B=8b 1KB=1024B 1MB=1024KB
5. 1位元組可以存放幾個漢字
在一些計算機系統中,4 個位元組代表一個字。
位元組是二進制數據的單位。一個位元組通常8位長。但是,一些老型號計算機結構使用不同的長度。為了避免混亂,在大多數國際文獻中,使用詞代替byte。在多數的計算機系統中,一個位元組是一個8位長的數據單位,大多數的計算機用一個位元組表示一個字元、數字或其他字元。
一個位元組也可以表示一系列二進制位。一些語言描述需要2個位元組表示一個字元,這叫做雙位元組字元集。一些處理器能夠處理雙位元組或單位元組指令。位元組通常簡寫為「B」,而位通常簡寫為小寫「b」,計算機存儲器的大小通常用位元組來表示。
(5)漢字存儲擴展閱讀:
位元組的換算:
1、ASCII碼:一個英文字母(不分大小寫)佔一個位元組的空間。一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數。換算為十進制 ,最小值-128,最大值127。如一個ASCII碼就是一個位元組。
2、UTF-8編碼:一個英文字元等於一個位元組,一個中文(含繁體)等於三個位元組。中文標點佔三個位元組,英文標點佔一個位元組。
3、Unicode編碼:一個英文等於兩個位元組,一個中文(含繁體)等於兩個位元組。中文標點占兩個位元組,英文標點占兩個位元組。
6. 存儲120個64*64點陣的漢字,需要佔存儲空間多少KB
15360位元組。
點陣漢字可以形象的理解為一個方形矩陣,一個32×32點陣漢字共有32×32個點。
每個點是否顯示可以用位元組中的bit是1或0來表示,1個位元組有8位(bit),標識漢字每行上的32個點需要用32÷8bit=4位元組,1個漢字有32行,則一共佔用32×4byte=128位元組。
所以存儲120個64*64點陣的漢字,需要120×128bytes=15360位元組。
15360bytes÷1024=15kbytes。
所謂一個字的點陣. 其實就是指這個漢字用多少個象素點來描述。每個象素點顯示為什麼顏色, 通常情況下, HZK16採用的是16*16點陣, 即256個象素點描述一個漢字。
這些點的顏色分為兩種,一種是前景色,一種是顯示為背景色。
可以這樣來考慮, 在紙上比較正正方方的寫一個規則的楷字, 然後在這個字的從上到下,左到右, 分別畫十七條直線, 那麼這個字就被放置於一個16*16的方格之內, 這樣就可以很明顯的看出, 16*16的方格內的具體哪些點有筆劃經過。
有筆劃經過與沒筆化經過的即就是應該被分別填充上前景色與背景色的點.現在,找到了一個漢字的點陣, 那麼還須要用數據來記錄點陣的信息, 通常情況下, 會用32個位元組來表示16*16點陣的漢字。
即每一行用二個位元組來記錄十六個象素點的色色彩情況, 0表示背景色, 1表示前景色。
16行其須要32個位元組。點陣漢字的原理同時也決定了它的缺點,他不具務放大特性,因為它的顯示是基於被定死的點陣,放大後,會產生明顯的鋸齒,非常的難看,當然,可以進行一些光滑處理,但基本上沒有多在的改觀。
但點陣漢字簡易, 對於復雜漢字, 它比矢量顯示漢字法更快帶.矢量顯示是基於記錄漢字的筆化的. 對於簡單的漢字它比較占優勢, 容易放大處理. 但對於復雜的漢字, 表示起來, 則筆化太多復雜。
(6)漢字存儲擴展閱讀:
點陣字型檔常用來作為顯示字型檔使用,這類點陣字型檔漢字最大的缺點是不能放大,一旦放大後就會發現文字邊緣的鋸齒。
矢量字型檔保存的是對每一個漢字的描述信息,比如一個筆劃的起始、終止坐標,半徑、弧度等等。在顯示、列印這一類字型檔時,要經過一系列的數學運算才能輸出結果,但是這一類字型檔保存的漢字理論上可以被無限地放大,筆劃輪廓仍然能保持圓滑,列印時使用的字型檔均為此類字型檔。
Windows使用的字型檔也為以上兩類,在FONTS目錄下,如果字體擴展名為FON,表示該文件為點陣字型檔,擴展名為TTF則表示矢量字型檔。
7. 漢字在電腦中如何存儲的
1.每個英文字元對應一個位元組----這就是ASCII碼,如31-'1',41-'A','61'-'a'.美國人定的標准.
2.漢字採用2位元組編碼(現在不完全准確),國家制定.現在的標準是GB18030,早期是GB2312-80.前者含蓋後者.
3.一個位元組是8位,ASCII碼最高位是'0'(所以最多128個編碼).
4.漢字將最高位置為'1',與ASCII碼(英文符號)區隔開.
5.軟體當讀取一個位元組時,先判斷最高位是否為'0'.若是,則作英文符號處理;若不是,再讀取下一個位元組,兩個位元組合一處對應一個漢字.如,B0A1-'啊',D5FE-'政'.
6.無論是ASCII碼還是漢字編碼,相當於身份證號.實際顯示出的漢字要到一個叫"漢字模庫'的文件中提取,它的位置與編碼有相對應的關系.
8. 計算機中存儲一個漢字需要幾位元組
一個漢字需要兩個位元組,英文則只需要一個位元組。
ASCII碼:一個英文字母(不分大小寫)佔一個位元組的空間。一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數。換算為十進制 ,最小值-128,最大值127。如一個ASCII碼就是一個位元組。
UTF-8編碼:一個英文字元等於一個位元組,一個中文(含繁體)等於三個位元組。中文標點佔三個位元組,英文標點佔一個位元組
Unicode編碼:一個英文等於兩個位元組,一個中文(含繁體)等於兩個位元組。中文標點占兩個位元組,英文標點占兩個位元組。
(8)漢字存儲擴展閱讀:
易混概念辨析
(1)字
在計算機中,一串數碼作為一個整體來處理或運算的,稱為一個計算機字,簡稱字。字通常分為若干個位元組(每個位元組一般是8位)。在存儲器中,通常每個單元存儲一個字,因此每個字都是可以定址的。字的長度用位數來表示。
在計算機的運算器、控制器中,通常都是以字為單位進行傳送的。字出現在不同的地址其含義是不相同。例如,送往控制器去的字是指令,而送往運算器去的字就是一個數。
(2)字長
計算機的每個字所包含的位數稱為字長。根據計算機的不同,字長有固定的和可變的兩種。固定字長,即字長度不論什麼情況都是固定不變的;可變字長,則在一定范圍內,其長度是可變的。
計算的字長是指它一次可處理的二進制數字的數目。計算機處理數據的速率,自然和它一次能加工的位數以及進行運算的快慢有關。如果一台計算機的字長是另一台計算機的兩倍,即使兩台計算機的速度相同,在相同的時間內,前者能做的工作是後者的兩倍。
一般地,大型計算機的字長為32-64位,小型計算機為12-32位,而微型計算機為4-16位。字長是衡量計算機性能的一個重要因素。
9. 為什麼存儲一個漢字需2位元組
1.44乘以1024的平方再除以2,應該是754974.72個漢字,約754974個漢字。