linuxutf8轉gbk

發布時間: 2022-04-25 21:29:32

Ⅰ 如何將UTF8文件轉碼成為GBK的

linux裡面可以用Vim，直接轉換

Ⅱ utf8和gbk可以直接轉換么

JS中的字元串本身就是以字元來存儲，而非位元組，所以沒有所謂的gbk或utf8；而encodeURI本身就會把字串以utf8編碼進行url編碼；想要以gbk形式轉換，就應該以Buffer來按位元組處理。應該這樣寫：var titleBuffer = new Iconv('UTF-8', 'GBK').convert('數學'); // 不要toString，直接以位元組數組形式存於buffer。

（1）utf8_encode是PowerBuilder的函數，該函數將data字元串轉換為 UTF-8 編碼，並返回編碼後的字元串。UTF-8 是一種用於將寬字元值轉換為位元組流的 Unicode 的標准機制。

（2）GBK即漢字內碼擴展規范，K為擴展的漢語拼音中"擴"字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標准兼容GB2312，共收錄漢字21003個、符號883個，並提供1894個造字碼位，簡、繁體字融於一庫。GB2312碼是中華人民共和國國家漢字信息交換用編碼，全稱《信息交換用漢字編碼字元集--基本集》，1980年由國家標准總局發布。基本集共收入漢字6763個和非漢字圖形字元682個，通行於中國大陸。新加坡等地也使用此編碼。GBK是對GB2312-80的擴展，也就是CP936字碼表 (Code Page 936)的擴展(之前CP936和GB 2312-80一模一樣)。

Ⅲ linux中文文件顯示亂碼怎麼解決

Linux文件名、文件內容亂碼，主要原因是windows上的中文編碼默認是GBK，而Linux默認中文編碼為UTF-8，由於編碼不一致，所以導致亂碼問題。
為了解決這個亂碼，需要對文件進行轉碼，具體如下：
1、前提保證已安裝了convmv；
2、具體convmv的用法：
Convmv
–f
源編碼
–t
新編碼
[選項]
文件名
一般常用參數：
-r
遞歸處理子目錄
--notest
真正進行操作，默認情況下是不對文件進行真實操作的，只是一個預覽
--list
顯示所有支持的編碼
--unescap
可以做一個轉義
3、比如我們有一個utf8的文件名，要求轉換成gbk編碼，命令如下：
Convmv
–f
utf-8
–t
gbk
–notest
文件名
也可以使用linux下最好用的編碼轉換工具iconv來進行轉碼操作。
例子：將GBK編碼的文件轉換成UTF－8
iconv
-f
GBK
-t
UTF-8
gbkfile.txt
>
utf8file.txt

Ⅳ Linux中如何查看文件編碼及對文件進行編碼轉換

查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式：
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題，那麼你可以在
~/.vimrc 文件中添加以下內容：

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

這樣，就可以讓vim自動識別文件編碼（可以自動識別UTF-8或者GBK編碼的文件），其實就是依照fileencodings提供的編碼列表嘗試，如果沒有找到合適的編碼，就用latin-1(ASCII)編碼打開。

文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換，iconv的命令格式如下：
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2

iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8

文件名編碼轉換:

從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件，有時會出現中文文件名亂碼的情況，出現這種問題的原因是因為，windows的文件名中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由於編碼不一致，所以導致了文件名亂碼的問題，解決這個問題需要對文件名進行轉碼。

在Linux中專門提供了一種工具convmv進行文件名編碼的轉換，可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。

首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。

下面看一下convmv的具體用法：

convmv -f 源編碼 -t 新編碼 [選項] 文件名

常用參數：
-r 遞歸處理子文件夾
--notest 真正進行操作，請注意在默認情況下是不對文件進行真實操作的，而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義，比如把%20變成空格
比如我們有一個utf8編碼的文件名，轉換成GBK編碼，命令如下：

convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以後"utf8編碼的文件名"會被轉換成GBK編碼（只是文件名編碼的轉換，文件內容不會發生變化）

Ⅳ 在Linux如何讓更改文件的字元編碼

1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8

2. enconv 轉換文件編碼，比如要將一個GBK編碼的文件轉換成UTF-8編碼，操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 轉換，iconv的命令格式如下：
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
查看文件編碼file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換 iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。用法： iconv [選項...] [文件...] 有如下選項可用: 輸入/輸出格式規范： -f, --from-code=名稱原始文本編碼 -t, --to-code=名稱輸出編碼信息： -l, --list 列舉所有已知的字元集輸出控制： -c 從輸出中忽略無效的字元 -o, --output=FILE 輸出文件 -s, --silent 關閉警告 --verbose 列印進度信息 -?, --help 給出該系統求助列表 --usage 給出簡要的用法信息 -V, --version 列印程序版本號例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 這個命令讀取aaa.txt文件，從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。

Ⅵ linux下中文顯示亂碼怎麼解決

linux下經常遇到的編碼問題如果你需要在Linux中操作windows下的文件，那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK（gb2312），而Linux一般都是UTF-8。
查看編碼的方法

方法一：file filename
方法二：在Vim中可以直接查看文件編碼
:set fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題，那麼你可以在
~/.vimrc 文件中添加以下內容：
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣，就可以讓vim自動識別文件編碼（可以自動識別UTF-8或者GBK編碼的文件），其實就是依照fileencodings提供的編碼列表嘗試，如果沒有找到合適的編碼，就用latin-1（ASCII）編碼打開
文件編碼轉換

多方法：
iconv 提供標準的程序和API來進行編碼轉換；
convert_encoding.py 基於Python的文本文件轉換工具；
decodeh.py 提供演算法和模塊來談測字元的編碼；
linux下文件編碼轉換：

方法一：

在Vim中直接進行轉換文件編碼，比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8

或者

11）設置文件集合，即要對哪些文件進行操作，可以使用通配符，比如我通常是對 C/C++ 源程序進行編碼轉換

:args *.h *.cpp

2）給出要在每個文件上執行的命令，這里是轉換編碼：

:argdo set fenc=utf-8 | update

方法二：

iconv 轉換

5.案例：

假如說我們將windows下的一個UTF-8的文件傳到linux環境下，linux環境下的系統編碼是GB18030，我們cat的時候就會出現亂碼，這個時候就應該想到轉碼了，下面我們來進行試驗：

我們將windows下一個名為UTF-8.sh的文件傳到linux系統中，其中UTF-8.sh的內容如下：

我是中文編碼UTF-8模式~

而linux系統的系統語言設置為：

[root@sor-sys zy]# cat /etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼：

[root@sor-sys zy]# file UTF-8.sh
UTF-8.sh: UTF-8 Unicode text, with no line terminators
[root@sor-sys zy]# cat UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys zy]#
[root@sor-sys zy]#

這個時候我們就需要轉換編碼了，記得使用iconv

[root@sor-sys zy]# iconv -f UTF-8 -t GB18030 UTF-8.sh -o GB18030.sh
[root@sor-sys zy]# cat GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys zy]#
[root@sor-sys zy]# file GB18030.sh
GB18030.sh: Non-ISO extended-ASCII text, with no line terminators
[root@sor-sys zy]#

convmv就是更改文件名編碼方式的一個工具。
比如

sudo convmv -f gbk -t utf-8 -r –notest /home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里 -f 後面為原來的編碼方式，-t 後面是要更改為的編碼方式， -r 表示這個目錄下面的所有文件， –notest 表示馬上執行，而不是僅僅測試而已。另外這命令好像要root才能執行，因此要加上 sudo。

Ⅶ linux 下中文 gbk 轉 utf-8

我試了說的情況，沒有報錯啊，在windows下使用文本編輯器輸入喆，字元編碼格式為GBK，並且跟其它漢字混合在一起，傳到linux上由於我的環境是utf-8的，所以是亂碼，然後運行
iconv -f GBK -t UTF-8 源文件 -o目標文件
打開目標文件，顯示一切正常了
備註：我的linux環境是suse linux enterprise server 11 sp3（x86_64）

Ⅷ 在linux服務上怎麼將weblogic默認的utf-8字元集改成gbk

就這么簡單。

按圖示操作吧

祝你愉快

Ⅸ 在linux中每次打開一個終端，終端的默認編碼為 utf-8，如何設置為讓他每次打開編碼為GBK

修改 i18n 這個文件。
一般系統默認在/etc/sysconfig/ 這個目錄下

Ⅹ linux下C語言轉uUTF-8為gbk只能轉兩個字何其

不知道你是不是在代碼裡面自己轉換，或者你的目的是什麼？
但是，漢字轉碼，不是增加編譯選項 -finput-charset=UTF-8 -fexec-charset=UTF-8 就可以了嗎？前一個是代碼編輯的時候的編碼格式，後一個是執行時顯示的編碼格式。

通常編輯的時候格式設置為ANSI，一般編譯後可以直接顯示。

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：842

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1105

python中的init方法發布：2025-10-20 08:17:33 瀏覽：812

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：979

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：868

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1217

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：440

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：320

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：996

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：964

linuxutf8轉gbk

與linuxutf8轉gbk相關的資訊