python数组乱码
① 为什么python写的爬虫有时候抓取的数据是乱码
为什么Python写的爬虫有时候抓取的数据是乱码
写爬虫是经常会遇到这样的问题,这种问题很显然是编码问题,解决的方法其实也不难。
你可以用下面的两个方法来解决你的编码问题:
第一种是,通过浏览器打开你写的html之后,找到浏览器中的文字编码修改,将编码改为Unicode编码,即可修复。
xml takes all the pain out of XML. Stephan Richter lxml是Python语言里和XML以及HTML工作的功能最丰富和最容易使用的库
② python 中文数组输出乱码
涉及到汉字编码问题,你的console可能设置成ascii解码了,可以把console改成unicode解码,同时注意保证python文件也是unicode编码的(一般utf-8)。
③ 怎么解决Python3乱码问题
如果是Python文件用编辑器打开时出现乱码,将编辑器调试成utf-8或者gb2312显示。如果是运行Python文件时显示乱码,则修改Python文件,在文件顶部添加:# code = utf-8
④ 关于Python前台取list时乱码
编码的问题,显示的时候将字符串的编码转换一下,如果原来的编码是utf-8,就这样,如果不是按相应的编码decode,然后再encode:
yourstr=yourstr.decode('utf-8').encode('gb2312')
我在我这试了下,完全可以啊。
t = ['\xe7\xa0\xb4\xe5\x9d\x8f', '\xe8\xbf\x90\xe7\xbb\xb4', '\xe7\xa0\x94\xe5\x8f\x91']
for i in range( len(t) ):
print t[i].decode('utf-8').encode('gb2312')
输出结果:
破坏
运维
研发
⑤ python异常乱码如何解决
如果页面是GB18030编码,而数据库是GBK编码,一般来说是不用转换的。GB18030是GBK的超级。GB18030本身兼容GBK,而GB18030中的部分字符GBK中是没有的。将GB18030字符写入GBK的数据库,只会丢失部分字符而已。一般网页上不会出现罕见的字符,所以这种情况是无需处理的。
所以,请仔细核对页面和数据库的编码。
即使你提供的页面、数据库编码是正确的,而且一定要转换,也应该这样做:
s='GB18030字符串'
s=s.decode('GB18030')#转化为unicode
s=s.encode('GBK')#转化为GBK
⑥ python 乱码问题
解决方法:
1.直接使用 u'是' 形式,指明以unicode编码,解码方式会以顶部 #coding定义的编码方式,如果不写,以操作系统当前编码方法,建议写上#coding,因为要让操作系统编码和源文件编码经常会不一样。推荐使用这种方式
2.输出时指定解码方法 print '是'.decode("utf8") ,必须和保存的编码一致,忽略#coding的定义
3.将#coding 和保存编码改为和操作系统一样的编码,就可以直接print '是' 正常输出,也不推荐,因为需要事先知道操作系统编码,复制到其他电脑上,操作系统编码不一样就会出错
#coding=gbk
print u'是' #方法1
print '是'.decode("gbk") #方法2
print '是' #方法3
注意:
#coding指明的编码必须和保存的编码一样,不然1,3方法都会产生错误,原因也是保存编码和读取编码不一致。一般IDE能够自动根据#coding保存文件
⑦ 执行python脚本出现乱码怎么解决
执行python脚本出现乱码的解决方法:首先把中文解码为unicode,具体方法如:【decode('utf-8')】;然后再转化为gbk即可,具体方法如:【encode('gbk')】。
问题:
代码中指定了UTF-8编码,但是在cmd命令行窗口时打印的中文仍然会乱码。
(推荐教程:Python入门教程)
原因:
windows下中文默认的输出编码为gbk ,与脚本中定义的UTF-8不一样,所以出现了解码失败的情况。
解决方法:
可以先把中文解码为unicode,然后再转化为gbk来解决这个问题。
举例:
运行结果:
⑧ python输出部分乱码
#-*-coding:UTF-8-*-
importsys
reload(sys)
print(sys.getdefaultencoding())#查看默认编码,我的是ascii
sys.setdefaultencoding('utf8')
print(sys.getdefaultencoding())#已经转为utf8了,应该没问题了
str=input('请输入:')#如果是python2建议用raw_input()
print'你输入的内容是:',str
⑨ python乱码问题
有两部分需要确认,服务器python编码,还有一个是客户端的编码。只要保持一致就没问题。