linuxpython乱码

发布时间: 2022-11-04 05:42:34

1. 请教一个关于 Pythin 2.7 中文乱码的问题

py2的编其实是最最贴近实际的编码形式了。反倒是py3，如果遇到个编码标记错误之类的问题，直接让你自杀……
先说编码是什么：我们知道计算机里存储任何数据都是存储的二进制，但是一串文字若是当图片那样存储太浪费空间不说，也会难以解析，所以ascii标准码使用了7位二进制标记了128个字符和控制符号。当然7位不利于数据对齐，所以干脆以8位存储，最高位补个0就好，正好一个字节，此即为基础ascii编码。
但是这128个字符里，虽然包含了常见英文符号和必须的控制符号（比如换行、回车、EOLN、EOF），却对使用其它语言的用户而言没法用，毕竟各家字符不同哇……
首先是欧系拉丁语系指出，既然一个字节一个字符，只用到7位，那么还有128个编号可以用，于是规定了相应的拉丁语系主要符号，同样单字节表示，这样就用到了多出来的一位，这套编码称之为latin-1
再往后，大多数其他拼音语言的国家表示，我们不用拉丁文符号，那么把那128个额外字符改成别的符号，映射自己的文字就没问题了。于是出现了多编码页，也就是最初的codepage。
但是中日韩为首的字形语言系的国家不行啊，你们丫的就几十个符号，可中文之类光常用字就好几千啊……于是针对中文出现了codepage936/gb2312，通过两个字节表示一个汉字，其中包含数千常用字，并且规定最高位为0的部分完全兼容ascii，但是若最高位为1，则必须是两个字节连续出现，用以表示一个汉字——随后还出现了GBK，规定的字符更多，兼容gb2312，同样是个双字节纪录。
然而有两件事情形成了阻碍：一是中文博大精深，汉字实在太多，算上生僻字，两个字节其实也不够用；另一方面，在GB系编码下，所有双字节字符都会被解释成汉字，因此最多做到英汉混排，多语言没戏，同时还会影响到诸如网络传输等等场景，因为同样的双字节二进制数据，对应GBK中文与对应的日文韩文显然不同，这就必须带着编码类型跑，稍不注意就不知道是个啥语言的玩意。
于是出现了unicode，是ANSI标准下的多国语言文字编码。unicode使用32位二进制表示每一个字符，且任意语言任意符号都有独立编码，这样就可以做到使用一套编码同时处理多种不同语言。
unicode是个编码方式，只涉及编号，并不管传输和存储。针对需求，unicode产生了若干传输用编码，其中比较普及的有utf32，utf16和utf8。utf32是每字符32位固定编码，完整映射unicode原编码而不做改变（当然，规定了一下传输时的端序问题）；utf16则是最少16位最多32位，属于变长unicode传输方案，以实现对部分codepage的兼容；而utf-8则是最小8位最大32位的编码，变长，且英文部分完全兼容ascii。由于省空间及ascii兼容这两点，使得改用utf8代价最小，才成为了主流。
python2里，与编码有关的有三个部分：
一是源代码识别问题。原本python解释器纯粹把源码使用ascii编码进行解析生成语法树。考虑到源码里可能存在其他语言的字符串量，提供了setdefaultencode接口，但是非常容易引发各类问题。PEP263指出在文件第一行或者第二行（仅限第一行为Unix脚本标注的情况下）写入特殊格式的注释# coding:xxx可以指定解释器解释源码时使用的字符编码。
第二部分则是内置类型转换：python2里的str类，其实是个不存储编码信息的类型。也就是说它把内容二进制按照逐个字节来处理和比对、运算。str类型的“字符串”如果拿来迭代一下，会直接拆成一个个字节来处理。但是，一旦我们需要对非单字节编码的单个字进行处理的时候，python只提供了一个类型来解决问题，即unicode类（注意，实质上py里这个类是utf8进行内存存储的，并不是utf32/unicode原编码），所以常常需要相互转换，将用到encode/decode两个方法。原则上是，decode方法是将一个str按照指定编码解析后转换为unicode，encode方法则是把一个unicode对象用指定编码表示并存储到一个str对象里。
第三点是输入输出。Python2的print的实质是将str里的东西输出到PIPE，如果你print的是一个unicode对象，它会自动根据LOCALE环境变量进行encode之后变成str再输出。然而一般在Windows上都没有设置locale环境变量，py2就按照默认的ascii编码进行处理，于是对中文自然就编码错误了。解决方法是手动encode成对应的输出端可接受的编码后输出。win下一般都是gbk，linux下一般都是utf8
py3中的str则是unicode，bytes才类似于原str，默认代码解析用utf8，默认输出编码也是utf8。

2. Redhat的LINUX下使用Python里pyodbc模块插入sql Server数据中文乱码

应该是数据库和python脚本编码方式不一样，你把脚本编码方式改成GBK或GB2312试试。

3. linux下python元祖中的中文print屏幕上显示乱码，怎么解决

这个并不是乱码，而是因为你输出的是列表。他以编码保存的而已。

你需要

foriinyoulist:
printi

这样出来的结果就是中文了

4. SUSE Linux乱码问题

解决方案无非就是把python的代码的开头编码用utf-8，打开数据库连接的时候也用charset='utf8'，还搞什么sys.setdefaultencoding('gbk')，mysql的my.cnf配置文件里面配置为utf-8。等等之类的东西，无效，插入中文还是乱码，就是插到数据库里面，直接看数据库里的中文都是编码，或者是????什么的。
把问题简单化，mysql的默认编码为latin1，查找mysqldb的源码关键报错的地方是cursor.execute，这里要执行一下encode(charset)，既然这里要encode，那就在外面先decode一下，果然什么都不改，在自己的调用函数里做decode。
sql
=
'insert
into
aa
values('测试')'
sql
=
sql.decode('latin1')
cursor.execute(sql)
这样就解决问题了，中文插入，中文显示，在终端命令行直接查看数据库也是中文。
试试，建表的时候不需要指定编码。

5. python中文乱码解决

windows下的文件路径，cmd窗口等默认编码都是gbk
但在windows下编写python程序的时候，我们一般采用的编码是utf-8
二者不一致是导致乱码的根本原因！
在pycharm下，为了中文不乱码，那么需要注意一下几个方面：
一、每一个源程序文件头部，需要加上
#-*-coding:utf-8;-*-
这样就没有乱码了

6. python中文乱码是怎么一回事

python报错invalid character in identifier，意思就是“标识符中的无效字符”，检查下有没有字符是中文的，把中文字符改成英文字符再运行就可以了。

Python的作者有意的设计限制性很强的语法，使得不好的编程习惯（例如if语句的下一行不向右缩进）都不能通过编译。其中很重要的一项就是Python的缩进规则。

一个和其他大多数语言（如C）的区别就是，一个模块的界限，完全是由每行的首字符在这一行的位置来决定的（而C语言是用一对花括号{}来明确的定出模块的边界的，与字符的位置毫无关系）。这一点曾经引起过争议。

因为自从C这类的语言诞生后，语言的语法含义与字符的排列方式分离开来，曾经被认为是一种程序语言的进步。不过不可否认的是，通过强制程序员们缩进（包括if，for和函数定义等所有需要使用模块的地方），Python确实使得程序更加清晰和美观。

(6)linuxpython乱码扩展阅读

Python 中文编码：

Python中默认的编码格式是 ASCII 格式，在没修改编码格式时无法正确打印汉字，所以在读取中文时会报错。

解决方法为只要在文件开头加入# -*- coding: UTF-8 -*-或者# coding=utf-8就行了

注意：# coding=utf-8的=号两边不要空格。

实例：

(Python 2.0+)

#!/usr/bin/python

# -*- coding: UTF-8 -*-

print( "你好，世界" )

输出结果为：

你好，世界

7. python终端输出乱码怎么解决

在命令行终端上工作时，经常会碰到一个头疼的问题就是中文乱码。下面我们就来看一下解决python在终端输出乱码的解决方法。

牵涉编码的地方一共有五处：

Python代码文件前两行声明的编码
Python代码文件实际存储所使用的编码
Vim的显示编码
Linux系统的文件编码
SecureCRT等终端设置的显示编码

严格来讲，五码一致的时候，如果文件没有损坏，应该是能够正常显示了。

Python编码声明：

如果python代码文件中包含中文，就一定要在代码文件的前两行（注意：一定要是前两行）做出编码声明，否则python代码默认采用ASCII保存，这样遇到中文字符就会报错。在代码头部声明编码的方式有三种：

# coding=<encoding name>
# -*- coding: <encoding name> -*-
# vim: set fileencoding=<encoding name>

Vim中有关编码的选项：

在 Vim 中，有四个与编码有关的选项，它们是：fileencodings、fileencoding、encoding 和 termencoding。

Linux系统的编码设置：

Linux的系统编码设置可以通过设置locale来完成，直接在命令行敲locale，然后回车，即可查看当前系统的编码设置，与保存文件相关的设置是LC_CTYPE。

如LC_CTYPE=zh_CN.gb18030，即把系统的编码设置成为了gb18030。

更多Python知识请关注Python自学网

8. linux python运行报编码错误

一次重启服务器后，supervisor接管的python脚本中的函数 open() 和 print() 都会报下面的编码错误：
UnicodeEncodeError: 'ascii' codec can't encode

使用的是python3，按理说编码都会默认utf-8，而且本地运行的python脚本并没有这个问题。

经大佬指点，增加环境变量 export LC_ALL="en_US.UTF-8" 后，再重启supervisor，问题解决

下面是复制的： https://www.cnblogs.com/badboy200800/p/11215981.html

Locale是一个软件在运行时的语言环境,。是根据计算机用户所使用的语言，所在国家或者地区，以及当地的文化传统所定义的。它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。

一个locale的书写格式为: 语言[ 地域[.字符集]]。完全的locale表达方式是 [语言[ 地域][.字符集] [@修正值]。例如：

zh_CN.GB2312 ＝> 中文_中华人民共和国＋国标2312字符集。

（1）locale把按照所涉及到的文化传统的各个方面分成12个大类

（2）查看标准字符集列表

常用字符集：en_US.utf8、zh_CN.gb2312、zh_CN.gbk、zh_CN.utf8等

3.Locale的设定

LC_ALL和LANG优先级的关系：LC_ALL > LC_* >LANG
（1）如果需要一个纯中文的系统的话，设定LC_ALL= zh_CN.XXXX即可。或者设定LANG=zh_CN.XXXX也可以，但是LC_ 不要有任何特殊设定才可以（因为LC_ 优先级高）。
（2）如果需要个性化的环境，例如只想要一个可以输入中文的环境，而保持菜单、标题，系统信息等等为英文界面，那么只需要设定LANG=en_US.XXXX，然后 LC_CTYPE＝zh_CN.XXXX就可以了。
（3）假如什么也不做的话，也就是LC_ALL，LANG和LC_*均不指定特定值的话，系统将采用POSIX作为lcoale，也就是C locale。

4.查看与设定字符集实践

（1）查看当前系统字符集三种方式（LC_ALL、LC_CTYPE和LANG），以查看LANG为例：

（2）更改系统字符集

备注：直接执行上述命令，可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。

（3）取消当前系统字符集（设定为空）

备注：直接执行上述命令，可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。

9. python 解压后全是英文乱码

用linux的话可以apt-get install untar-gzip ，好像是这个命令，我电脑没带，等我下次再回你，我用这个软件解压，所有的都没有乱码

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：887

制作脚本网站发布：2025-10-20 08:17:34 浏览：1154

python中的init方法发布：2025-10-20 08:17:33 浏览：858

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1024

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：908

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1256

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：475

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：361

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1035

python股票数据获取发布：2025-10-20 07:39:44 浏览：1013

linuxpython乱码

与linuxpython乱码相关的资讯