pythonutf8乱码

发布时间: 2022-10-21 10:17:27

‘壹’ python中文乱码解决

windows下的文件路径，cmd窗口等默认编码都是gbk
但在windows下编写python程序的时候，我们一般采用的编码是utf-8
二者不一致是导致乱码的根本原因！
在pycharm下，为了中文不乱码，那么需要注意一下几个方面：
一、每一个源程序文件头部，需要加上
#-*-coding:utf-8;-*-
这样就没有乱码了

‘贰’ python解决csv文件用excel打开乱码问题

【问题】

python输出的csv文件用excel打开，里面的中文会变成乱码，但用window下的记事本或mac下的numbers打开就正常显示。

原因是python输出的文件是utf-8编码写入的，excel默认以gbk方式读取，导致乱码发生。

【解决方法1】文件产出时encoding设置为utf-8-sig

用excel打开csv时，excel会先检查文件的第一个字符，来了解这个文件是什么编码方式，如果这个字符是BOM，excel就知道用utf-8的方式打开这个文件。python自带了处理BOM的编码方式uft-8-sig，因此只需要在文件产出时将encoding设置为utf-8-sig。

如果文件不是由python产出的，只需要以utf-8方式读入再以utf-8-sig方式存储即可

【解决方法2】懒人法，适用只含简体中文的文件

用记事本打开，点击另存为，右下角编码方式选择“ANSI”，这个过程是把这个文件改成gbk编码格式，excel就是默认用gbk方式打开的。

参考： Python写的csv文件，如何让 Excel 双击打开不乱码？ - 云+社区 - 腾讯云

对编码格式一窍不通的可以阅读以下网页

python笔记——二进制和文件编码_砍柴姑娘Jourosy的博客-CSDN博客

编码方式之ASCII、ANSI、Unicode概述 - 蓝海人 - 博客园

【简单总结】：

1. 首先需要了解字符集和字符编码两个概念，字符集定义了字符和二进制的一一对应关系，字符编码规定了如何将字符的编号存储到计算机中。

2. Unicode是字符集，包含了全球文字的唯一编码，utf-8是编码方式，将unicode以某种方式存储到计算机中。

3. 有些字符集和编码是结合在一起的，称作字符集还是编码都无所谓，比如ASCII，GBK

4. ANSI是各个国家地区不同扩展编码方式的总称，互不兼容（可以看出来通用性没有utf好）

5. 不同编码方式在转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。

‘叁’ python中文显示乱码，已经在开头有了coding: utf-8

乱码原因：
因为你的文件声明为 utf-8，并且也应该是用 utf-8 的编码保存的源文件。但是 windows 的本地默认编码是 cp936，也就是 gbk 编码，所以在控制台直接打印 utf-8 的字符串当然是乱码了。

解决方法：

py文件用记事本打开，另存为utf-8格式即可

‘肆’ python读取文件解决‘utf8’ codec can’t decode byte 0xa1的问题

一般这种文件存在类似字符：

如果UTF-8搞不定，可以采取ISO-8859-1编码方式解决：

最早的编码是iso8859-1，和ascii编码相似。但为了方便表示各种各样的语言，逐渐出现了很多标准编码，重要的有如下几个。

很明显，iso8859-1编码表示的字符范围很窄，无法表示中文字符。但是，由于是单字节编码，和计算机最基础的表示单位一致，所以很多时候，仍旧使用iso8859-1编码来表示。而且在很多协议上，默认使用该编码。比如，虽然"中文"两个字不存在iso8859-1编码，以gb2312编码为例，应该是"d6d0 cec4"两个字符，使用iso8859-1编码的时候则将它拆开为4个字节来表示："d6 d0 ce c4"（事实上，在进行存储的时候，也是以字节为单位处理的）。而如果是UTF编码，则是6个字节"e4 b8 ad e6 96 87"。很明显，这种表示方法还需要以另一种编码为基础。

需要说明的是，定长编码便于计算机处理（注意GB2312/GBK不是定长编码），而unicode又可以用来表示所有字符，所以在很多软件内部是使用unicode编码来处理的，比如java。

注意，虽然说utf是为了使用更少的空间而使用的，但那只是相对于unicode编码来说，如果已经知道是汉字，则使用GB2312/GBK无疑是最节省的。不过另一方面，值得说明的是，虽然utf编码对汉字使用3个字节，但即使对于汉字网页，utf编码也会比unicode编码节省，因为网页中包含了很多的英文字符。

‘伍’ python print中文乱码问题 win10 Python2

python2字符串编码的问题，如果要输出中文可以使用u前缀，这样就可以直接使用了

a=u'你好'
printa

这样就可以了

‘陆’ Python 网络编程问题，如图，为什么utf-8会乱码怎么改呢

你在存.py文件时，将字符编码改成UTF-8的（用记事本另存为，就有编码格式选择那一项）

盲猜你是用的windows写代码，代码格式是ANSI格式

‘柒’ python中文乱码是怎么一回事

python报错invalid character in identifier，意思就是“标识符中的无效字符”，检查下有没有字符是中文的，把中文字符改成英文字符再运行就可以了。

Python的作者有意的设计限制性很强的语法，使得不好的编程习惯（例如if语句的下一行不向右缩进）都不能通过编译。其中很重要的一项就是Python的缩进规则。

一个和其他大多数语言（如C）的区别就是，一个模块的界限，完全是由每行的首字符在这一行的位置来决定的（而C语言是用一对花括号{}来明确的定出模块的边界的，与字符的位置毫无关系）。这一点曾经引起过争议。

因为自从C这类的语言诞生后，语言的语法含义与字符的排列方式分离开来，曾经被认为是一种程序语言的进步。不过不可否认的是，通过强制程序员们缩进（包括if，for和函数定义等所有需要使用模块的地方），Python确实使得程序更加清晰和美观。

(7)pythonutf8乱码扩展阅读

Python 中文编码：

Python中默认的编码格式是 ASCII 格式，在没修改编码格式时无法正确打印汉字，所以在读取中文时会报错。

解决方法为只要在文件开头加入# -*- coding: UTF-8 -*-或者# coding=utf-8就行了

注意：# coding=utf-8的=号两边不要空格。

实例：

(Python 2.0+)

#!/usr/bin/python

# -*- coding: UTF-8 -*-

print( "你好，世界" )

输出结果为：

你好，世界

‘捌’ python命令行输入中文乱码怎么办

python2.X，代码中指定了UTF-8，但是在cmd命令行窗口时，打印的中文仍然会乱码。

在python3不存在该问题

运行结果：

原因

中文windows默认的输出编码为gbk ，与脚本中定义的UTF-8不一样，所以出现了解码失败的情况。

相关推荐：《Python基础教程》

解决方法

有如下两种方法可以解决这个问题

方法一

我们可以通过先把中文解码为unicode，然后再转化为gbk来解决这个问题：

修改后运行结果：

方法二

当然，我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题：

·chcp 65001 就是换成UTF-8代码页

·chcp 936 可以换回默认的GBK

但是这样就降低了脚本的兼容性，在其他环境运行的时候可能还会出现这样的错误，而且可能会影响其他脚本运行，所以推荐使用第一种方法。

‘玖’ 执行python脚本出现乱码怎么解决

执行python脚本出现乱码的解决方法：首先把中文解码为unicode，具体方法如：【decode('utf-8')】；然后再转化为gbk即可，具体方法如：【encode('gbk')】。
问题：
代码中指定了UTF-8编码，但是在cmd命令行窗口时打印的中文仍然会乱码。
（推荐教程：Python入门教程）
原因：
windows下中文默认的输出编码为gbk ，与脚本中定义的UTF-8不一样，所以出现了解码失败的情况。
解决方法：
可以先把中文解码为unicode，然后再转化为gbk来解决这个问题。
举例：
运行结果：

阅读全文

热点内容

脚本反转剧情发布：2024-12-27 02:02:53 浏览：732

c语言是什么软件发布：2024-12-27 01:56:43 浏览：596

二叉树递归算法发布：2024-12-27 01:55:06 浏览：881

安卓怎么氪金日服发布：2024-12-27 01:53:39 浏览：9

linux增加命令发布：2024-12-27 01:37:13 浏览：720

遗传算法的过程发布：2024-12-27 01:16:51 浏览：132

win7电脑密码怎么查看发布：2024-12-27 01:16:18 浏览：843

浪潮电脑通信服务器发布：2024-12-27 01:12:16 浏览：154

安卓镜像投屏怎么看一会就退出发布：2024-12-27 00:43:39 浏览：81

phppostget区别发布：2024-12-27 00:34:03 浏览：284

pythonutf8乱码

与pythonutf8乱码相关的资讯