pythonxml中文乱码

发布时间: 2023-07-21 08:09:05

㈠ python读取中文目录出现乱码

先对路径进行unicode处理，然后再打开。举例：

inpath = 'E:\MyProject\SVN_Project\Drawingboard_local\model\mydata\input\proction\示波器\0.htm'
uipath = unicode(inpath, "utf8")
然后用"uipath"经过编码后的路径去open()即可:
fin = open(uipath)

㈡ python3 中文输出乱码问题

python 3和2很大区别就是python本身改为默认用unicode编码。
字符串不再区分"abc"和u"abc", 字符串"abc"默认就是unicode，不再代表本地编码、
由于有这种内部编码，像c#和java类似，再没有必要在语言环境内做类似设置编码，比如“sys.setdefaultencoding”;
也因此也python 3的代码和包管理上打破了和2.x的兼容。2.x的扩展包要适应这种情况改写。

另一个问题是语言环境内只有unicode怎么输出gbk之类的本地编码。

答按惯例都在(序列化)输出时才转换成本地编码。
比如

file.write("GBK的中文".encode("GBK"))

python环境内字符串用str.encode("GBK")方法输出成字节串用于和其他环境交流。

㈢ python中文返回的乱码问题

#-*- coding: utf-8 -*-
import win32api
import win32con
import time
from win32gui import *

def getWindow():
titles = set()
def foo(hwnd,nouse):
if IsWindow(hwnd) and IsWindowEnabled(hwnd) and IsWindowVisible(hwnd):
#对增加的内容指定编码格式，运行调试通过，没有乱码
titles.add(GetWindowText(hwnd).decode('utf-8'))
EnumWindows(foo, 0)
print(titles)
if __name__=='__main__':
time.sleep(3)
getWindow()

㈣ python中文显示乱码，已经在开头有了coding: utf-8

乱码原因：
因为你的文件声明为 utf-8，并且也应该是用 utf-8 的编码保存的源文件。但是 windows 的本地默认编码是 cp936，也就是 gbk 编码，所以在控制台直接打印 utf-8 的字符串当然是乱码了。

解决方法：

py文件用记事本打开，另存为utf-8格式即可

㈤如何判断中文乱码 python

如果页面是GB18030编码，而数据库是GBK编码，一般来说是不用转换的。GB18030是GBK的超级。GB18030本身兼容GBK，而GB18030中的部分字符GBK中是没有的。将GB18030字符写入GBK的数据库，只会丢失部分字符而已。一般网页上不会出现罕见的字符，所以这种情况是无需处理的。

所以，请仔细核对页面和数据库的编码。

即使你提供的页面、数据库编码是正确的，而且一定要转换，也应该这样做：

s = 'GB18030字符串'
s = s.decode('GB18030') # 转化为unicode
s = s.encode('GBK') # 转化为GBK

㈥ python编程中中文输出乱码UnicodeEncodeError: 'ascii' codec can't encode character

楼主你好！肆余

其实按照你的代码的逻辑来做是没有错的，无法显示成utf-8编码的文本其实是因为在request请求的时候，按照网页的标识转了码，接着BeautifulSoup把已经是utf-8的文本又强转了一次utf-8编码，导致了无法正确的显示，以想要拿到的尘银时间为例，其实程序的目标字符串应该如下：

#-*-coding:utf-8-*-

'''我们想要使用的字符串'''
target_str=':53'

'''两次转码后的字符串'''
get_str=u':53'

归根结底是两个对象的类不同，但python不支持这两种类型的强转，个人想了个比较临时的解决方案，算是个python打了个补丁，就是将字符串转成二进制，再转回字符串，这样就unicode就不用给他加上编码方式再转成二进制字符串了，修改后的代码如下：

#-*-coding:utf-8-*-
importrequests
frombs4importBeautifulSoup
fromdatetimeimportdatetime

defencode(s):
'''将字符串转成二进制'''
return''.join([bin(ord(c)).replace('0b','')forcins])

defdecode(s):
'''将二进制转换成字符串'''
return''.join([chr(i)foriin[int(b,2)forbins.split('')]])

res=requests.get('
)
res.encodeing='utf-8'

soup=BeautifulSoup(res.text,'html.parser')

'''每个中文字符都进行转换处理'''
title=decode(encode(soup.select('#artibodyTitle')[0].text))
time=decode(encode(soup.select('.time-source')[0].contents[0].strip()))

chinese='%Y年%m月%d日%H:%M'
timesource=datetime.strptime(time,chinese)
print(title)
print(timesource)

看楼主在研究的过程中，对字符串的编码原理的理解还有所欠派雹宴缺，这方面的资料在网上很多，可以再自行研究一下，能够获得长足的进步。

望采纳，谢谢！

㈦ python print中文乱码问题 win10 Python2

python2字符串编码的问题，如果要输出中文可以使用u前缀，这样就可以直接使用了

a=u'你好'
printa

这样就可以了

㈧ python命令行输入中文乱码怎么办

python2.X，代码中指定了UTF-8，但是在cmd命令行窗口时，打印的中文仍然会乱码。

在python3不存在该问题

运行结果：

原因

中文windows默认的输出编码为gbk ，与脚本中定义的UTF-8不一样，所以出现了解码失败的情况。

相关推荐：《Python基础教程》

解决方法

有如下两种方法可以解决这个问题

方法一

我们可以通过先把中文解码为unicode，然后再转化为gbk来解决这个问题：

修改后运行结果：

方法二

当然，我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题：

·chcp 65001 就是换成UTF-8代码页

·chcp 936 可以换回默认的GBK

但是这样就降低了脚本的兼容性，在其他环境运行的时候可能还会出现这样的错误，而且可能会影响其他脚本运行，所以推荐使用第一种方法。

㈨ python输出到文件乱码如何解决

python代码文件的编码
py文件默认是ASCII编码，中文在显示时会做一个ASCII到系统默认编码的转换，这时就会出错：SyntaxError: Non-ASCII character。需要在代码文件的第一行或第二行添加编码指示：
1 # coding=utf-8 ##以utf-8编码储存中文字符
2 print '中文'
像上面那样直接输入的字符串是按照代码文件的编码来处理的，如果用unicode编码，有以下三种方式：
1 s1 = u'中文' #u表示用unicode编码方式储存信息
2 s2 = unicode('中文','gbk')
unicode是一个内置函数，第二个参数指示源字符串的编码格式。
decode是任何字符串具有的方法，将字符串转换成unicode格式，参数指示源字符串的编码格式。
encode也是任何字符串具有的方法，将字符串转换成参数指定的格式。
（2）、字符串的编码
用 u'汉字' 构造出来的是unicode类型，不用的话构造出来是str类型
str的编码是与系统环境相关的，一般就是sys.getfilesystemencoding()得到的值
所以从unicode转str，要用encode方法
从str转unicode，所以要用decode
例如：
# coding=utf-8 #默认编码格式为utf-8
s = u'中文' #unicode编码的文字
print s.encode('utf-8') #转换成utf-8格式输出
但当python中间处理非ASCII编码时，经常会出现如下错误：
UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)
0x??是超出128的数字，python在默认的情况下认为语言的编码是ascii编码，所以无法处理其他编码，需要设置python的默认编码为所需要的编码。
一个解决的方案是在代码中添加：
import sys
reload(sys)
sys.setdefaultencoding('utf-8') （其中utf-8为你想输出的字符编码）
解释：
sys.setdefaultencoding方法在python导入site.py后就删除了(具体代码查看site.py就可以看到)因此如果想用的话可以再重新load进入
总结：
u=u'unicode编码文字'
g=u.encode('gbk') #转换为gbk格式
print g #此时为乱码，因为当前环境为utf-8,gbk编码文字为乱码
str=g.decode('gbk').encode('utf-8') #以gbk编码格式读取g（因为他就是gbk编码的,需要事先知道它是GBK编码）并转换为utf-8格式输出
print str #正常显示中文（同文件输出）
安全的方法：
s.decode('gbk','ignore').encode('utf-8′) #以gbk编码读取（当然是读取gbk编码格式的文字了）并忽略错误的编码，转换成utf-8编码输出。
推荐学习《Python教程》！

阅读全文

热点内容

安卓怎么把游戏分辨率发布：2025-04-09 14:19:39 浏览：362

gpu并行编程发布：2025-04-09 13:55:07 浏览：147

termux桌面服务器设置ip 发布：2025-04-09 13:52:05 浏览：304

x8f源码发布：2025-04-09 13:52:04 浏览：105

安卓手机如何把原图的马赛克去掉发布：2025-04-09 13:41:06 浏览：245

如何修改网银U盾密码发布：2025-04-09 13:30:40 浏览：196

安卓渠道服怎么更换账号发布：2025-04-09 13:29:54 浏览：549

linux读取文件c 发布：2025-04-09 13:29:44 浏览：327

python字符串追加发布：2025-04-09 13:26:48 浏览：796

学之书数据库发布：2025-04-09 13:26:07 浏览：639

pythonxml中文乱码

与pythonxml中文乱码相关的资讯