linux中文乱码
‘壹’ linux下中文显示乱码怎么解决
linux下经常遇到的编码问题如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看编码的方法
方法一:file filename
方法二:在Vim中可以直接查看文件编码
:set fileencoding
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开
文件编码转换
多方法:
iconv 提供标准的程序和API来进行编码转换;
convert_encoding.py 基于Python的文本文件转换工具;
decodeh.py 提供算法和模块来谈测字符的编码;
linux下文件编码转换:
方法一:
在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
或者
11)设置文件集合,即要对哪些文件进行操作,可以使用通配符,比如我通常是对 C/C++ 源程序进行编码转换
:args *.h *.cpp
2)给出要在每个文件上执行的命令,这里是转换编码:
:argdo set fenc=utf-8 | update
方法二:
iconv 转换
5.案例:
假如说我们将windows下的一个UTF-8的文件传到linux环境下,linux环境下的系统编码是GB18030,我们cat的时候就会出现乱码,这个时候就应该想到转码了,下面我们来进行试验:
我们将windows下一个名为UTF-8.sh的文件传到linux系统中,其中UTF-8.sh的内容如下:
我是中文编码UTF-8模式~
而linux系统的系统语言设置为:
[root@sor-sys zy]# cat /etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
这个时候查看一下文件的内容及编码:
[root@sor-sys zy]# file UTF-8.sh
UTF-8.sh: UTF-8 Unicode text, with no line terminators
[root@sor-sys zy]# cat UTF-8.sh
锘挎垜鏄?腑鏂囩紪镰乁TF-8妯″纺~[root@sor-sys zy]#
[root@sor-sys zy]#
这个时候我们就需要转换编码了,记得使用iconv
[root@sor-sys zy]# iconv -f UTF-8 -t GB18030 UTF-8.sh -o GB18030.sh
[root@sor-sys zy]# cat GB18030.sh
??我是中文编码UTF-8模式~[root@sor-sys zy]#
[root@sor-sys zy]# file GB18030.sh
GB18030.sh: Non-ISO extended-ASCII text, with no line terminators
[root@sor-sys zy]#
convmv就是更改文件名编码方式的一个工具。
比如
sudo convmv -f gbk -t utf-8 -r –notest /home
就是将/home目录下原来文件名是gbk编码方式的全部改为utf-8格式的。这里 -f 后面为原来的编码方式,-t 后面是要更改为的编码方式, -r 表示这个目录下面的所有文件, –notest 表示马上执行,而不是仅仅测试而已。另外这命令好像要root才能执行,因此要加上 sudo。
‘贰’ linux中文乱码如何解决
可以了解下,简单
‘叁’ 如何解决 linux 的乱码问题
出现这种情况的原因为两种操作系统的中文压缩方式不同,在windows环境中中文压缩一般为gbk,而在linux环境中为utf8,这就导致了在windows下能正常显示
txt文件在linux环境下打开呈现了乱码状态。
解决方法:在linux用iconv命令,输入命令如下
iconv -f gbk -t utf8 file.pdf > file.pdf.utf8
此时会重生一file.utf8文件,打开之后就能正常显示中文
linux系统下修改语言配置方法有:
法一:修改/etc/profile文件,增加export LANG=zh_CN.GB18030
法二:修改/etc/sysconfig/i18n文件,将
#LANG="en_US.UTF-8"
#SUPPORTED="en_US.UTF-8:en_US:en"
#SYSFONT="latarcyrheb-sun16"
改为
LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030"
SYSFONT="latarcyrheb-sun16"
/etc/profile: 为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行.
/etc/sysconfig/i18n 这里存放的是系统的区域语言设置
LANG 表明你当前系统的语言环境变量设置 ,这里是 zh_CN.GB18030
SUPPORTED 表明系统预置了那些语言支持 ,不在项目中的语言不能正常显示
SYSFONT 定义控制台终端字体,你文本登录的时候显示的字体是 latarcyrheb-sun16
I18N 是 internationalization 的缩写形式,意即在 i 和 n 之间有 18 个字母,本意是指软件的“国际化”.I18N支持多种语言,不过同一时间只能是英文和一种选定的语言,例如英文+中文、英文+德文、英文+韩文等等;
如果在SCRT上操作时中文乱码,可依次点击options--session options--appearance,选择character encoding为UTF-8
‘肆’ linux 部分中文文件乱码怎么解决
因为缺少中文语言包的支持。
以下三种方式,任选一种,安装一下中文支持环境。
方法一:yum方式——完全的中文环境支持。
[[email protected] ~]#yum groupinstall chinese-support
[[email protected] ~]# yum groupinstall -support
在上面的命令中, 是下列之一: assamese, bengali, chinese, gujarati, hindi, japanese, kannada, korean, malayalam, marathi, oriya, punjabi, sinhala, tamil, thai, 或 telegu。
方法二:yum方式,命令分开执行:
[[email protected] ~]# yum install fonts-chinese fonts-ISO8859-2-75dpi
方法三比较土:rpm方式。安装盘上找到语言包
[[email protected] ~]# rpm -ivh fonts-chinese-3.02-9.6.el5.noarch.rpm
[[email protected] ~]# rpm -ivh fonts-ISO8859-2-75dpi-1.0-17.1.noarch.rpm
‘伍’ linux中文文件名乱码怎么解决
中文乱码一般是语言包没有安装引起的。
可下载中文语言包yum groupinstall chinese-support
临时更换语言
如果只是临时更换linux系统的语言环境, LANG=Zn_CN.UTF-8
或者直接修改系统默认语言
Vi /etc/sysconfig/i18n
LANG="Zn_CN.UTF-8"
可参考http://jingyan..com/article/ab69b270de8b4f2ca7189f1d.html
谢谢采纳!
‘陆’ linux 中文乱码
先执行一次export LANG=UTF-8
然后再ls看看还有乱码没
如果没有了,可以把上面的语句加到.profile中
‘柒’ 求助linux中文乱码解决方案。。。
方框跟乱码不一样的,你要记住啊,方框是字体的原因导致的,修改fcitx的配置文件把里面的字体改成系统有的字体。。乱码是因为编码识别错误导致的,不是方块那种。。终端里面的话,你在终端上面的菜单里调一下编码就行了吧,点右键也能调编码的貌似。。
‘捌’ linux下汉字变为乱码
XP下使用混合编码,中文又有gb又有utf8,所以非常混乱。当代linux使用的大多数是utf8编码,同样显示中文,但是不通用。
系统全部改成gb编码可能会造成某些新软件出现问题,全部用utf8则可能出现xp拷贝来的文档乱马,所以一般采取多策略
1:如果只是浏览个别文档,使用浏览器来浏览,用firefox来观看
2:如果是分区,挂载的时候指明gb编码,具体参考本版本的mount
3:如果非要拷贝,可以选择utf8转换成gb码,具体命令参考 iconv
一般格式iconv -f oo -t xx > filename
‘玖’ linux显示中文乱码怎么解决
Linux中文显示不正常大多是终端字符集设置的不对,因为终端屏幕显示信息是以设置的语言来显示的,如果语言是英文或者其他编码语言设置,显示中文时就是乱码。设置终端字符集需要设置LANG这个环境变量,设置方法是在终端输入LANG=zh_CN.UTF-8,设置好LANG变量后,再在终端上用ls命令查看一下带有中文的文件名应该就有效果了。
如果经过上面的设置后,用ls命令可以正常列出中文文件名了,那就最好将LANG=zh_CN.UTF-8这一行添加到~/.bashrc这个配置文件中,然后执行命令:source ~/.bashrc,使配置文件的设置马上生效,这样终端就被完美的设置成UTF-8中文编码了。