c語言漢字編碼

發布時間: 2022-06-20 09:09:42

❶ c語言中文編碼的問題

輸入可以採用GB2312或者GBK編碼，如果繁體，就用UTF-8
讀入漢字，從文件或者標准輸入讀，每次讀一個位元組，依次存入數組
如果可以確定是全部漢字，那麼可以一次讀入兩個位元組
結束符可以用\0,但是由於雙位元組漢字編碼低位可能是0 所以結束符要用雙\0
針對英文字元和漢字混合的情況，可以這樣判斷
每次讀入一個字元，如果該字元大於0x80 則這是一個漢字的高位，繼續讀入並存儲
如果該字元小於0x80 則這是一個英文字元，直接存儲

do
read one byte
check
if > 0x80 read next
save
while(!end)
大致這樣
直到讀入約定的end標志，可以是\n 可以是eof

❷ 請問如何用C語言實現漢字，和Unicode編碼的轉換

字轉換：wctomb、mbtowc，wc 指 Wide charactor，mb 指 Multi-byte。
字元串轉換：wcstombs、mbstowcs，wcs 和 mbs 的 s 指 string。

這 4 個函數是 C 標准函數庫函數中的。如果只是在 Windows 平台下編程，可直接調用 Windows API 函數 WideCharToMultiByte 和 MultiByteToWideChar 實現。但是如果調用標准庫函數的話，在 linux 下也是有效的。調用標准庫函數，首先必須包含 locale.h 並調用 setlocale(LC_ALL, "") 後才能正確轉換。Windows 下的 Multi-byte 是 ANSI 編碼的，Wide charactor 是 Unicode (UTF-16) 編碼，而 Linux 下的 Multi-byte 是 UTF-8 編碼的，Wide charactor 是 Unicode (UTF-32) 編碼。

#include <stdio.h>
#include <stdlib.h>
#include <locale.h>

int main(void)
{
char str[12];
wchar_t wstr[] = { 0x52B3, 0x788C, 0 };
setlocale(LC_ALL, "");
wcstombs(str, wstr, sizeof(str)/sizeof(char));
printf("%s", str);
return 0;
}

❸ c語言中，漢字使用什麼編碼方式

DOS下是GB2312
(包含6763個漢字)
Windows下(主要是指Visual
Studio)是ANSI，這是Windows默認的編碼方式
(這其實就是用「記事本」保存文件時默認的編碼，據說記事本用這個編碼的時候跟
"聯通"兩個字有過節)
Linux不太清楚，現在據說都是UTF的，以前不是

❹ C語言漢字機內碼特點是什麼漢字輸入輸出的原理

1、漢字編碼方式很多，有國標碼（GB2312_1980)，大五碼，GBK,簡體18030，區位碼，電報碼，還有它們的變形：unicode 大端小端碼,UTF-8，UTF-*,HZ 等等。
內碼特點：二進制雙位元組，每位元組用到8bits.
輸入原理,把連續輸入的ASCII字元串，通過中文輸入軟體轉化為雙位元組中文內碼。
輸出原理，從雙位元組中文內碼查出字體（font)和「刻痕",放大/縮小,在頻幕或紙上顯示列印出來。

2、在C語言中，可以通過將漢字作為字元串輸入。
由於一個漢字佔2個位元組，所以對漢字的操作，只能以2個位元組作為操作單位。
下面通過具體實例來說明漢字在C語言中的使用：
char s[] = "首都北京"; // 將漢字字元賦值給字元數組
char s2[20]; // 定義字元數組，存放用戶輸入的漢字
scanf("%s", s2); // 接收用戶輸入的漢字字元
printf("%d\n", sizeof(s)); // 計算字元數組s所佔的內存單元，輸出9（最後一個位元組是結束字元'\0'）
printf("%s\n", &s[2]); // 輸出「都北京」（首字佔2個位元組）
printf("%s\n", s2); // 輸出用戶輸入的漢字

❺ 用c語言怎樣得到一個漢字的GB2312編碼

源代碼是GB2312編碼方式寫的就比較簡單

voidprintgb(unsignedchar*s){
	while(*s){
		if(*s>=0x7f){
			printf("%02x%02x",*s,*(s+1));
			s+=2;
		}
		else{
			printf("%04x",*(s++));
		}
	}
}
intmain(){
	printgb("2017你好中國greatchina");
	return0;
}

❻ C語言和漢字編碼的問題求教

為了區別於普通ASCII碼，漢字編碼一般在ASCII碼之外，或者是兩位元組的第一位元組在其之外，方法就是在漢字區位碼上加一個固定的數字。但漢字有多套編碼，互相不通用，可網路漢字編碼了解詳細信息。
為了顯示漢字內碼，可以在字元串中判斷是否遇到漢字內碼，如果是再按照編碼規則解出漢字的區、位碼，或者直接顯示，
比如：char *str="漢字編碼"; printf("%u,%u\n",(unsigned int)str[0],(unsigned int)str[1]);
用內碼顯示漢字即為反方向賦值，如漢字「保」的國際碼為B1A3H，那麼構造字元串"保「的語句如下：
char *str[256]; unsigned int *p; p=str; *p=0xa3b1; //小端模式或者 str[0]=0xb1; str[1]=0xa3;

❼ c語言是用什麼編碼的

C語言是沒有編碼的。它的編碼就是平台的默認編碼。
比方說在windows 上漢字編碼用gb2312 或者說cp936(GBK一般的windows默認代碼頁,windows分為不同的代碼頁，可以查看一下MSDN)。
http://msdn.microsoft.com/zh-cn/goglobal/cc305153(en-us).aspx

C里char 就是一個位元組。你定義一個漢字，比方說 char *p=「中」C語言用兩個位元組來存儲;
p指向的兩個位元組存儲的就是『中』的gb編碼。分別是『\xd6\xd0』。
當然如果用printf("%s",p) 輸入到屏幕的話，它會自動解碼輸出『中』這個字。
如果在linux平台下，它一般是uft-8編碼的，道理大概一樣。

❽ 在C語言中怎樣才能得到漢字的ASCII碼

ascii碼指的是0~255的單位元組編碼。
漢字是沒有ascii碼值的。
同一個漢字
根據編碼方式
佔2~4的位元組，有不同的實際碼值。
要列印這個碼值，最簡單的方法
就是把漢字存儲字元數組，然後列印字元數組的各個值。
比如
1234unsigned char str[]="列印漢字碼值";int i;for(i = 0; i < sizeof(str); i ++) printf("%02x", str[i]);

❾ C語言中如何用編碼輸出中文字元

計算機用兩個位元組來表示一個漢字，「我」在內存里就是這樣存放的:CE
D2。CE是str[0]的內容，D2是str[1]的內容。第一次循環輸出str[0]，但是這個字元在ASCII字元集里代表這樣一個東西Î(不知道在這兒能不能正常顯示……)，但是Windows的命令提示符程序讀取到這里就會自動使用寬字元集，也就是說，它已經准備好讀取下一個字元，然後把他們當成一個字元顯示出來。於是就出現了那個漢字。
#include
<stdio.h>
int
main()
{
printf("%c%c",(char)0xce,(char)0xd2);
}

❿ 在C語言中怎樣獲得漢字編碼

C語言中，我們用整數輸出字元得到的就是該字元的ASII碼，如用整數輸出a，得到97
但是，漢字用的是兩個位元組存儲，我們需要分別輸出者兩個位元組，就相當於輸出該漢子的編碼。
C語言支持ASCII，而GB2312與ASCII是兼容的，所以可以在C語言中獲得漢字的GB2312編碼
GB2312是兩個位元組的，第一位元組是高八位，第二位元組是低八位，比如下面的程序：

#include<stdio.h>
#include<string.h>
intmain(){
chara[5];
strcpy(a,"啊");
printf("%XH%XH
",(unsignedchar)a[0],(unsignedchar)a[1]);
return0;
}

a[0]是「啊」字的高八位，a[1]是低八位，程序運行結果是a[0]=B0 a[1]=A1，用16進製表示的，所以「啊」字的GB2312編碼是B0A1了。輸出時要強制轉換成unsigned char，不然就變成負數了，因為編碼是以8位的無符號整數為單位的。
也可以轉成10進制，例如：
int b=(unsigned char)a[0]*256+(unsigned char)a[1];
b即為漢字的10進制GB2312編碼了

閱讀全文

熱點內容

好屋源碼發布：2025-03-20 19:24:02 瀏覽：73

安卓手機怎麼改手勢接聽發布：2025-03-20 19:23:47 瀏覽：993

手機wifi在哪個文件夾發布：2025-03-20 19:22:57 瀏覽：401

平板電腦怎麼緩存動漫發布：2025-03-20 19:20:10 瀏覽：40

永恆紀元有腳本嗎發布：2025-03-20 19:18:32 瀏覽：839

運演算法求發布：2025-03-20 19:17:47 瀏覽：208

咋看電腦的伺服器地址發布：2025-03-20 19:16:16 瀏覽：262

康拓2演算法發布：2025-03-20 19:11:49 瀏覽：597

跨平台編譯語言有哪些發布：2025-03-20 19:08:25 瀏覽：780

音樂appftp安卓發布：2025-03-20 19:03:24 瀏覽：306

c語言漢字編碼

與c語言漢字編碼相關的資訊