设置python默认编码
‘壹’ python默认的字符编码是什么
Python的默认编码是ASCII格式:
ASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号;
源代码文件中,如果有用到非ASCII字符,则需要在文件头部进行字符编码的声明,如下:#-*- coding: UTF-8 -*-
实际上Python只检查#、coding和编码字符串,其他的字符都是为了美观加上的。另外,Python中可用的字符编码有很多,并且还有许多别名,还不区分大小写,比如UTF-8可以写成u8。
‘贰’ 如何设置python的编码格式为utf-8
重装了系统(ubuntu 14.04)原来正常可用的OpenERP项目在切换到开发者模式的时候报错:
UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)
而在服务器上的项目正常可用,其原因是由于python的默认编码设置为ascii,可以用以下命令查看:
import sys
sys.getdefaultencoding()
解决方案有两种:
1. 在项目启动文件中添加设置字符为utf8:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
2. 在python的lib文件夹下的sitecustomize.py文件中添加代码:(我的文件位于/usr/lib/python2.7)
import sys
reload(sys)
sys.setdefaultencoding('utf8')
try:
import apport_python_hook
except ImportError:
pass
else:
apport_python_hook.install()
relaod(sys)一句是必须的
‘叁’ python3.3中文乱码与默认编码格式设定。
我这边输出没有什么问题。
下面是输出:
i = 1
s['statuses'][0]['text'] = 出轨是男人的天性,防小三是女人一生的战役。
s['statuses'][1]['text'] = 漂亮女孩有时候比普通女孩更可怜。男人可以很坦然的拒绝普通女孩的感情和身体,但是男人会欺骗漂亮女孩的感情从而得到她的身体。这就是为什么古人说红颜命薄,你们感受一下。
s['statuses'][2]['text'] = 留几手教你如何利用空闲时间学习
。。。
i = 2
s['statuses'][20]['text'] = 骂人,其实内容并不重要,一个小萝莉,满嘴脏话,也吓不住人。
。。。
i = 3
s['statuses'][40]['text'] = 我不就是在你家住的时候吃了几只烧鸡没给你钱么?至于这么编排我么?这情节都是你在哪本言情小说里扒出来的吧?
后面省略了。
前提就是这个样子的
‘肆’ 如何设置python的编码格式为utf-8
python的编码格式?
#coding=utf-8
这是文档编码
import sys
sys.setdefaultencoding("utf-8")
这是设置默认编码方式为utf-8
xx.encode("utf-8")
这是字符串编码操作
import codecs
codecs.open(xx,'r','utf-8"),这是文件编码读取方式
‘伍’ python3如何把字符串转换成系统默认编码
python 3和2很大区别就是python本身改为默认用unicode编码。
字符串不再区分"abc"和u"abc", 字符串"abc"默认就是unicode,不再代表本地编码、
由于有这种内部编码,像c#和java类似,再没有必要在语言环境内做类似设置编码,比如“sys.setdefaultencoding”;
也因此也python 3的代码和包管理上打破了和2.x的兼容。2.x的扩展包要适应这种情况改写。
另一个问题是语言环境内只有unicode怎么输出gbk之类的本地编码。
答按惯例都在(序列化)输出时才转换成本地编码。
比如
1
file.write("GBK的中文".encode("GBK"))
python环境内字符串用str.encode("GBK")方法输出成字节串用于和其他环境交流。
‘陆’ python默认编码问题
编码就是二进制序列和代表的文本字符之间的映射关系。
你说的大多数问题是python2的,python3已经自动解决了,不需要这么麻烦。默认是utf8.
另外平时遇到的编码问题,通常又和源码本身的编码、系统终端显示的编码、字体纠结在一起,要考虑的因素挺多的。
个人认为理解编码最好的方法是尝试用写二进制序列的方法,输出你想要的文本,多试错就理解了。
‘柒’ Python基本编码格式
1、一般来说,声明编码格式在脚本中是必需的。2、如果Python源码文件没有声明编码格式,Python解释器会默认使用ASCII编码。但出现非ASCII编码的字符,Python解释器就会报错。
1、Python 采用代码缩进和冒号( : )来区分代码块之间的层次。2、在 Python 中,对于类定义、函数定义、流程控制语句、异常处理语句等,行尾的冒号和下一行的缩进,表示下一个代码块的开始,而缩进的结束则表示此代码块的结束。3、Python 中实现对代码的缩进,可以使用空格或者 Tab 键实现。但无论是手动敲空格,还是使用 Tab 键,通常情况下都是采用 4 个空格长度作为一个缩进量(默认情况下,一个 Tab 键就表示 4 个空格)。4、对于 Python 缩进规则,初学者可以这样理解,Python 要求属于同一作用域中的各行代码,它们的缩进量必须一致,但具体缩进量为多少,并不做硬性规定。
正确示例代码:
错误示例代码:
Python中使用 # 进行注释,我们在使用# 的时候,# 号后面要空一格在行内注释的时候,中间应该至少加两个空格
print("你好,世界") # 注释
** 使用的一般性原则:**
1、在二元运算符两边各空一格,算术操作符两边的空格可灵活使用,但两侧务必要保持一致2、不要在逗号、分号、冒号前面加空格,但应该在它们后面加(除非在行尾)3、函数的参数列表中,逗号之后要有空格4、函数的参数列表中,默认值等号两边不要添加空格5、左括号之后,右括号之前不要加添加空格6、参数列表, 索引或切片的左括号前不应加空格
使用的一般性原则:
1、编码格式声明、模块导入、常量和全局变量声明、顶级定义和执行代码之间空两行2、顶级定义之间空两行,方法定义之间空一行3、在函数或方法内部,可以在必要的地方空一行以增强节奏感,但应避免连续空行
1、导入总应该放在文件顶部,位于模块注释和文档字符串之后,模块全局变量和常量之前。
2、导入应该按照从最通用到最不通用的顺序分组,分组之间空一行:
3、每个 import 语句只导入一个模块,尽量避免一次导入多个模块
命名规范这一块的大家应该都比较熟悉了,但是不同的编程语言之间的明明规范也是有所区别的~
Python命名建议遵循的一般性原则:
引号使用的一般性原则:
Python跟其他几个主流编程语言的分号使用区别很大Python的代码末尾不需要加分号,而Java和C#等都需要添加
不要在行尾添加分号,也不要用分号将两条命令放在同一行,例如:
Python学习日记
‘捌’ Python怎么改默认编码
#-*-coding:UTF-8-*-
#必须写在第一行,如果用其他编码,修改coding:后的值就可以了
‘玖’ python3.3.1怎么设置默认编码为utf-8
有个比较稳妥的办法,读写文件的时候多加个参数,open('test.txt', 'r', encoding='utf-8')