當前位置:首頁 » 操作系統 » linuxutf8轉gbk

linuxutf8轉gbk

發布時間: 2022-04-25 21:29:32

Ⅰ 如何將UTF8文件轉碼成為GBK的

linux裡面可以用Vim,直接轉換

Ⅱ utf8和gbk可以直接轉換么

JS中的字元串本身就是以字元來存儲,而非位元組,所以沒有所謂的gbk或utf8;而encodeURI本身就會把字串以utf8編碼進行url編碼;想要以gbk形式轉換,就應該以Buffer來按位元組處理。應該這樣寫:var titleBuffer = new Iconv('UTF-8', 'GBK').convert('數學'); // 不要toString,直接以位元組數組形式存於buffer。

(1)utf8_encode是PowerBuilder的函數,該函數將data字元串轉換為 UTF-8 編碼,並返回編碼後的字元串。UTF-8 是一種用於將寬字元值轉換為位元組流的 Unicode 的標准機制。

(2)GBK即漢字內碼擴展規范,K為擴展的漢語拼音中"擴"字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標准兼容GB2312,共收錄漢字21003個、符號883個,並提供1894個造字碼位,簡、繁體字融於一庫。GB2312碼是中華人民共和國國家漢字信息交換用編碼,全稱《信息交換用漢字編碼字元集--基本集》,1980年由國家標准總局發布。基本集共收入漢字6763個和非漢字圖形字元682個,通行於中國大陸。新加坡等地也使用此編碼。GBK是對GB2312-80的擴展,也就是CP936字碼表 (Code Page 936)的擴展(之前CP936和GB 2312-80一模一樣)。

Ⅲ linux中文文件顯示亂碼怎麼解決

Linux文件名、文件內容亂碼,主要原因是windows上的中文編碼默認是GBK,而Linux默認中文編碼為UTF-8,由於編碼不一致,所以導致亂碼問題。
為了解決這個亂碼,需要對文件進行轉碼,具體如下:
1、前提保證已安裝了convmv;
2、具體convmv的用法:
Convmv
–f
源編碼
–t
新編碼
[選項]
文件名
一般常用參數:
-r
遞歸處理子目錄
--notest
真正進行操作,默認情況下是不對文件進行真實操作的,只是一個預覽
--list
顯示所有支持的編碼
--unescap
可以做一個轉義
3、比如我們有一個utf8的文件名,要求轉換成gbk編碼,命令如下:
Convmv
–f
utf-8
–t
gbk
–notest
文件名
也可以使用linux下最好用的編碼轉換工具iconv來進行轉碼操作。
例子:將GBK編碼的文件轉換成UTF-8
iconv
-f
GBK
-t
UTF-8
gbkfile.txt
>
utf8file.txt

Ⅳ Linux中如何查看文件編碼及對文件進行編碼轉換

查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。

文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2

iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8

文件名編碼轉換:

從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名 中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由於編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。

在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。

首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。

下面看一下convmv的具體用法:

convmv -f 源編碼 -t 新編碼 [選項] 文件名

常用參數:
-r 遞歸處理子文件夾
--notest 真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:

convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以後"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)

Ⅳ 在Linux如何讓更改文件的字元編碼

1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8

2. enconv 轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
查看文件編碼file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換 iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。 用法: iconv [選項...] [文件...] 有如下選項可用: 輸入/輸出格式規范: -f, --from-code=名稱 原始文本編碼 -t, --to-code=名稱 輸出編碼 信息: -l, --list 列舉所有已知的字元集 輸出控制: -c 從輸出中忽略無效的字元 -o, --output=FILE 輸出文件 -s, --silent 關閉警告 --verbose 列印進度信息 -?, --help 給出該系統求助列表 --usage 給出簡要的用法信息 -V, --version 列印程序版本號 例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 這個命令讀取aaa.txt文件,從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。

Ⅵ linux下中文顯示亂碼怎麼解決

linux下經常遇到的編碼問題如果你需要在Linux中操作windows下的文件,那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看編碼的方法

方法一:file filename
方法二:在Vim中可以直接查看文件編碼
:set fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開
文件編碼轉換

多方法:
iconv 提供標準的程序和API來進行編碼轉換;
convert_encoding.py 基於Python的文本文件轉換工具;
decodeh.py 提供演算法和模塊來談測字元的編碼;
linux下文件編碼轉換:

方法一:

在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8

或者

11)設置文件集合,即要對哪些文件進行操作,可以使用通配符,比如我通常是對 C/C++ 源程序進行編碼轉換

:args *.h *.cpp

2)給出要在每個文件上執行的命令,這里是轉換編碼:

:argdo set fenc=utf-8 | update

方法二:

iconv 轉換

5.案例:

假如說我們將windows下的一個UTF-8的文件傳到linux環境下,linux環境下的系統編碼是GB18030,我們cat的時候就會出現亂碼,這個時候就應該想到轉碼了,下面我們來進行試驗:

我們將windows下一個名為UTF-8.sh的文件傳到linux系統中,其中UTF-8.sh的內容如下:

我是中文編碼UTF-8模式~

而linux系統的系統語言設置為:

[root@sor-sys zy]# cat /etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼:

[root@sor-sys zy]# file UTF-8.sh
UTF-8.sh: UTF-8 Unicode text, with no line terminators
[root@sor-sys zy]# cat UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys zy]#
[root@sor-sys zy]#

這個時候我們就需要轉換編碼了,記得使用iconv

[root@sor-sys zy]# iconv -f UTF-8 -t GB18030 UTF-8.sh -o GB18030.sh
[root@sor-sys zy]# cat GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys zy]#
[root@sor-sys zy]# file GB18030.sh
GB18030.sh: Non-ISO extended-ASCII text, with no line terminators
[root@sor-sys zy]#

convmv就是更改文件名編碼方式的一個工具。
比如

sudo convmv -f gbk -t utf-8 -r –notest /home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里 -f 後面為原來的編碼方式,-t 後面是要更改為的編碼方式, -r 表示這個目錄下面的所有文件, –notest 表示馬上執行,而不是僅僅測試而已。另外這命令好像要root才能執行,因此要加上 sudo。

Ⅶ linux 下 中文 gbk 轉 utf-8

我試了說的情況,沒有報錯啊,在windows下使用文本編輯器輸入喆,字元編碼格式為GBK,並且跟其它漢字混合在一起,傳到linux上由於我的環境是utf-8的,所以是亂碼,然後運行
iconv -f GBK -t UTF-8 源文件 -o目標文件
打開目標文件,顯示一切正常了
備註:我的linux環境是suse linux enterprise server 11 sp3(x86_64)

Ⅷ 在linux服務上怎麼將weblogic默認的utf-8字元集改成gbk

就這么簡單。

按圖示操作吧

祝你愉快

Ⅸ 在linux中每次打開一個終端,終端的默認編碼為 utf-8,如何設置為讓他每次打開編碼為GBK

修改 i18n 這個文件。
一般系統默認在/etc/sysconfig/ 這個目錄下

Ⅹ linux下C語言轉uUTF-8為gbk只能轉兩個字何其

不知道你是不是在代碼裡面自己轉換,或者你的目的是什麼?
但是,漢字轉碼,不是增加編譯選項 -finput-charset=UTF-8 -fexec-charset=UTF-8 就可以了嗎? 前一個是代碼編輯的時候的編碼格式,後一個是執行時顯示的編碼格式。

通常編輯的時候格式設置為ANSI,一般編譯後可以直接顯示。

熱點內容
密碼本子的密碼一般都是什麼 發布:2024-10-03 14:29:11 瀏覽:745
易語言網路驗證源碼 發布:2024-10-03 14:24:53 瀏覽:365
平板電腦安卓444很卡怎麼辦 發布:2024-10-03 14:20:31 瀏覽:604
如何查安卓app最初發布時間 發布:2024-10-03 14:20:31 瀏覽:562
安卓如何進文件夾 發布:2024-10-03 14:19:55 瀏覽:801
c語言年份 發布:2024-10-03 13:42:03 瀏覽:569
電視尺寸演算法 發布:2024-10-03 13:30:58 瀏覽:65
內網自己搭建伺服器 發布:2024-10-03 13:13:31 瀏覽:669
雲存儲看不清 發布:2024-10-03 13:06:20 瀏覽:220
hld編程 發布:2024-10-03 13:03:18 瀏覽:179