漢字存儲使用
1. 漢字在電腦中如何存儲的
1.每個英文字元對應一個位元組----這就是ASCII碼,如31-Ƈ',41-'A',ཹ'-'a'.美國人定的標准.x0dx0a2.漢字採用2位元組桐枝編碼(現在不完全准確),國家制定.現在的標準是GB18030,早期是GB2312-80.前者含蓋後者.x0dx0a3.一個位元組是8位,ASCII碼最高位是Ɔ'(所以最多128個編碼).x0dx0a4.漢字將最高位置為Ƈ',與ASCII碼(英文符號)區隔開.x0dx0a5.軟體當讀取一個位元組時,先判斷最高位是否為Ɔ'.若是,則作英文符號處理;若不是,再讀取下一個位元組,兩個位元組合一處對應一個漢字.如,B0A1-'啊',D5FE-'政'.x0dx0a6.無論是ASCII碼還是漢字編碼,相當於身份證號.實際顯示出的配老漢字要到一個叫"漢字模庫'的文件中提取,它的位置與編碼有局賣敏相對應的關系.
2. 漢字數字化存儲必須使用格式處理的方式
採用Unicode編碼Unicode是一種國際標準的字元編碼,可以將漢字轉換為統一的編碼,從而使漢字能夠跨平台存儲和傳輸。
1、採用GBK/GB2312編碼GBK/GB2312是漢字編碼的國家標准,它可以將漢字進行編碼,從而使漢字能夠在中文系統中存儲和傳輸。則銀
2、採用GB18030編碼山搏GB18030是一種漢字編碼,它支持更多的漢字,可以支持更多語種,從而使漢字能夠在多種語言環境中存儲和傳輸。
3、採用UTF-8編碼UTF-8是一種Unicode的編碼,它可逗盯祥以支持多種語言,從而使漢字可以在多種語言環境中存儲和傳輸。
3. 漢字數字化存儲必須使用矩陣處理的方式
用點陣矩陣的方顫型式存儲的。
漢字字形的存儲是用點陣矩陣的方式存儲的,假設48X48點的漢字字形,表示水平方向上有48個點,垂直方向上也有衫含48個點,這樣總共的點數是48X48=2304個點,每個點用1個二進制位茄塌猜表示,則2304個點需要用2304÷8=288個位元組。
漢字數字分好幾種,阿拉伯數字是最普遍的一種。阿拉伯數字並不是阿拉伯人發明的而是印度人發明的,實際應該列為印度語言,只是先傳播到阿拉伯,然後傳向世界的,所以稱之為「阿拉伯數字」。
4. 計算機對漢字進行處理和存儲時使用漢字的
機內碼。在計算機中,對漢字進行傳輸、處理和存儲時使用漢字的機內碼。GB2312-80是我國第一個漢字編碼國標,其中規定一個漢字占兩個扮扮知位元組,即16bit。國標碼使每個漢字都有了唯一對應的碼。
在計算機中,對漢字進行傳廳消輸、處理和存儲時使用漢字的機內碼。GB2312-80是我國第一個漢字編碼國標,其中規定一個漢字占兩個位元組,即16bit。國標碼使每個漢字都有了唯一對應的碼,但在計算機內國標碼會與ASCII碼沖突,所以將國標碼每個位元組加128避開了ASCII,成為了漢字傳輸、處理和存儲時使用的機內碼。缺銷字形碼存儲的是漢字的點陣圖,用於顯示或列印漢字時使用漢字。