linux文件編碼格式
⑴ 如何在 linux 中將文件編碼轉換為 UTF-8
1、iconv命令來轉換文件的編碼,格式:
iconv -f 原本的編碼格式 -t 要轉換成的編碼 文件名 -o 新文件名
2、例如:
iconv -f gb2312 -t utf8 a.txt -o utf8.txt
3、vim 文件名.txt
:set fileencoding
:set fenc
查看現在文本的編碼
:set fenc=編碼
轉換當前文本的編碼為指定的編碼
:set encoding=編碼
:set enc=編碼
以指定的編碼顯示文本,但不保存到文件中。
輸入 :e ++enc=gbk 強制用gbk打開
輸入 :w ++enc=utf8 轉換到utf8保存。
4、可以使用 file 命令,並添加 -i 或 --mime 參數來查看一個文件的字元編碼
file -i a.txt
⑵ 如何批量修改linux 文件編碼格式
批量轉換文件的編碼當然是使用命令來轉換咯,如果文件太多還可以寫一個shell腳本進行批量轉換,Linux系統中轉換文件編碼格式的命令是iconv。iconv命令的使用介紹一下,iconv命令很簡單,記住它的三個參數就可以了,下面是它的三個參數:
-f參數:表示from,就是原本的編碼格式
-t參數:表示to,就是後來的新編碼
-o參數:表示輸出文件,就是轉換編碼後的新文件的文件名,如果沒有這個參數新文件會將原來的文件覆蓋掉。
下面是將GB2312編碼的文件轉換成UTF-8編碼的例子:
iconv -f gb2312 -t utf8 mygb2312.txt -o myutf8.txt
這個例子中mygb2412.txt就是要轉換的文件,myutf8.txt就是轉換後的新文件。
⑶ Linux中如何查看文件編碼及對文件進行編碼轉換
查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8
文件名編碼轉換:
從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名 中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由於編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。
在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。
首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。
下面看一下convmv的具體用法:
convmv -f 源編碼 -t 新編碼 [選項] 文件名
常用參數:
-r 遞歸處理子文件夾
--notest 真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:
convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以後"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)
⑷ linux下怎麼查看文件的編碼方式
常見的比如在visual
studio
中寫的c\c++程序需要放到linux主機上編譯,而程序的中文注釋則顯示為亂碼,比較嚴重的是由於編碼原因,linux上的編譯器報錯。
1、用vim查看文件編碼
在vim
中可以直接查看文件編碼
:set
fileencoding
即可顯示文件編碼格式。
2、
改寫~/.vimrc
文件
如果你只是想查看其它編碼格式的文件或者想解決用vim查看文件亂碼的問題,那麼你可以在
~/.vimrc
文件中添加以下內容:
set
encoding=utf-8
fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別utf-8或者gbk編碼的文件),其實就是依照
fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ascii)編碼打開。
3、
用iconv文件編碼轉換
我們利用iconv工具對文件的編碼進行轉換。
iconv
轉換,iconv的命令格式如下:
iconv
-f
encoding
-t
encoding
inputfile
比如將一個gbk
編碼的文件轉換成utf-8編碼
iconv
-f
gbk
-t
utf-8
file1
-o
file2
其中的參數的意義表示
-f
from
某個編碼
⑸ linux 怎麼檢測文件名的編碼格式
1.在vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
2.
enconv
轉換文件編碼,比如要將一個gbk編碼的文件轉換成utf-8編碼,操作如下
enconv
-l
zh_cn
-x
utf-8
filename
3.
iconv
轉換,iconv的命令格式如下:
iconv
-f
encoding
-t
encoding
inputfile
比如將一個utf-8
編碼的文件轉換成gbk編碼
iconv
-f
gbk
-t
utf-8
file1
-o
file2
查看文件編碼file命令
file
ip.txt
ip.txt:
utf-8
unicode
text,
with
escape
sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換
iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。
用法:
iconv
[選項...]
[文件...]
有如下選項可用:
輸入/輸出格式規范:
-f,
--from-code=名稱
原始文本編碼
-t,
--to-code=名稱
輸出編碼
信息:
-l,
--list
列舉所有已知的字元集
輸出控制:
-c
從輸出中忽略無效的字元
-o,
--output=file
輸出文件
-s,
--silent
關閉警告
--verbose
列印進度信息
-?,
--help
給出該系統求助列表
--usage
給出簡要的用法信息
-v,
--version
列印程序版本號
例子:
iconv
-f
utf-8
-t
gb2312
aaa.txt
>bbb.txt
這個命令讀取aaa.txt文件,從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。
⑹ linux轉換文件編碼格式
在 Vim 中直接進行轉換文件編碼,比如將一個文件轉換成 utf-8格式 :set fileencoding=utf-8;
iconv 轉換,iconv 的命令格式如下:輸入/輸出格式規范:iconv -f, --from-code=名稱 原始文本編碼 -t, --to-code=名稱 ,比如說將一個 UTF-8 編碼的文件轉換成 GBK 編碼 iconv -f GBK -t UTF-8 file1 -o file2
enconv 轉換文件編碼 比如要將一個 GBK 編碼的文件轉換成 UTF-8編碼,操作如下 enconv -L zh_CN -x UTF-8 filename
⑺ linux下怎麼改變文件的編碼格式
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. enconv 轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下
enconv -L zh_CN -x UTF-8 filename
3. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
查看文件編碼file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換 iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。 用法: iconv [選項...] [文件...] 有如下選項可用: 輸入/輸出格式規范: -f, --from-code=名稱 原始文本編碼 -t, --to-code=名稱 輸出編碼 信息: -l, --list 列舉所有已知的字元集 輸出控制: -c 從輸出中忽略無效的字元 -o, --output=FILE 輸出文件 -s, --silent 關閉警告 --verbose 列印進度信息 -?, --help 給出該系統求助列表 --usage 給出簡要的用法信息 -V, --version 列印程序版本號 例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 這個命令讀取aaa.txt文件,從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。
⑻ linux查看文件編碼格式命令
i).在 Vim 中可以直接查看文件編碼(shift + :)輸入set fileencoding 即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用 Vim 查看文件亂碼的問題,那麼你可以在 ~/.vimrc 文件中添加以下內容: set
encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936 這樣, 就可以讓 vim 自動識別文件編碼
(可以自動識別 UTF-8或者 GBK 編碼的文件) ,其實就是依照 fileencodings
提供的編碼列表嘗試,如果沒有找到合適的編碼,就用 latin-1(ASCII)編碼打開。
ii). enca (需要安裝)查看文件編碼:$enca filename filename: Universal
transformation format 8 bits; UTF-8 CRLF line terminators 需要說明一點的是,enca
對某些 GBK 編碼的文件識別的不是很好,識別時會出現: Unrecognized encoding
iii)還有一種很簡單的方式,file 文件名 可以查看非elf文件的編碼格式
⑼ linux下如何查看文件編碼格式及轉換文件編碼
常見的比如在Visual Studio 中寫的C\C++程序需要放到Linux主機上編譯,而程序的中文注釋則顯示為亂碼,比較嚴重的是由於編碼原因,linux上的編譯器報錯。
1、用VIM查看文件編碼
在Vim 中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
2、 改寫~/.vimrc 文件 如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照 fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
3、 用ICONV文件編碼轉換
我們利用iconv工具對文件的編碼進行轉換。
iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個GBK 編碼的文件轉換成UTF-8編碼
iconv -f GBK -t UTF-8 file1 -o file2
其中的參數的意義表示
-f From 某個編碼
⑽ linux怎麼查看文件的編碼格式
root@localhost:~# file a.sh
a.sh: ASCII text