Python3文件
A. python3 & 如何在Python中写文件路径
Python中文件路径共分为两种:绝对路径和相对路径
1、绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件。
2、 相对路径是以当前文件为基准进行一级级目录指向被引用的资源文件。
其中大小写不影响windows定位到文件
python 文件路径书写方式有两种:
方法一:使用转义字符
filePath = 'E:\Temp\test'
方法二:使用r声明字符串
filePath = r'E:\Temp\test'
上述写法中"\ “为字符串中的特殊字符,加上r后变为原始字符串,则不会对字符串中的”\t"、"\r" 进行字符串转义。
B. Python3 输入输出和File(文件) 方法
Python两种输出值的方式: 表达式语句和 print() 函数。第三种方式是使用文件对象的 write() 方法,标准输出文件可以用 sys.stdout 引用。
如果你希望输出的形式更加多样,可以使用 str.format() 函数来格式化输出值。如果你希望将输出的值转成字符串,可以使用 repr() 或 str() 函数来实现。
str(): 函数返回一个用户易读的表达形式。
repr(): 产生一个解释器易读的表达形式。
str.format() 的使用
读取键盘输入
Python 提供了 input() 内置函数,从标准输入读入一行文本,默认的标准输入是键盘。
open() 用于打开一个文件,并返回文件对象,基本语法格式如下:
open(filename, mode='r')
完整的语法格式为:
open(filename, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
filename: 必需,文件路径+文件名称(相对或者绝对路径)
mode: 可选,文件打开模式:只读,写入,追加等,默认模式为只读(r)
buffering: 设置缓冲
encoding: 一般使用utf8
errors: 报错级别
newline: 区分换行符
closefd: 传入的file参数类型
opener: 设置自定义开启器,开启器的返回值必须是一个打开的文件描述符。
不同模式mode打开文件的说明:
t 文本模式 (默认的模式)
b 二进制模式,一般用于非文本文件如图片等
x 写模式,新建一个文件,如果该文件已存在则会报错
+ 打开一个文件进行更新(可读可写)
r 以只读方式打开文件。文件的指针将会放在文件的开头。是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。
f.write(string) 将 string 写入到文件中, 然后返回写入的字符数
f.writelines(sequence) 向文件写入一个序列字符串行表,如果需要换行则要自己加入每行的换行符。
f.read(size) 读取一定数目的数据, 然后作为字符串或字节对象返回。size 是一个可选参数。当 size 参数忽略或者为负, 那么该文件的所有内容都将被读取并且返回。
f.readline() 从文件中读取单独的一行。换行符为 '\n'。读取整行,包括 "\n" 字符。f.readline() 如果返回一个空字符串, 说明已经读取到最后一行。
f.readlines([sizeint])] 读取所有行并返回列表类型,若给定sizeint>0,返回总和大约为sizeint字节的行, 并且将这些字节按行分割。实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。
f.seek() 移动文件读取指针到指定位置,如果要改变文件当前的位置, 可以使用f.seek(offset, from_what) 函数。from_what 的值(默认为0), 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:
seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
seek(x,1) : 表示从当前位置往后移动x个字符
seek(-x,2):表示从文件的结尾往前移动x个字符
file.flush() 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入
file.fileno() 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上
file.isatty() 如果文件连接到一个终端设备返回 True,否则返回 False
file.truncate([size]) 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。
f.close() 关闭文件并释放系统的资源。关闭后文件不能再进行读写操作,否则会抛出异常
当处理一个文件对象时, 使用 with 关键字是非常好的方式。在结束后, 它会帮你正确的关闭文件。 而且写起来也比 try - finally 语句块要简短:
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作能够将程序中运行的对象信息保存到文件中去,永久存储。通过pickle模块的反序列化操作能够从文件中创建上一次程序保存的对象。
基本接口:
pickle.mp(obj, file, [,protocol])
有了 pickle 对象, 就能对 file 以读取的形式打开:
x = pickle.load(file)
从 file 中读取一个字符串,并将它重构为原来的python对象。
示例:使用pickle模块将数据对象保存到文件
示例:使用pickle模块从文件中重构python对象
C. Python3文件重命名
因为你没有“E:/tensorflow/初赛训练数据/test/callreason”该目录
你应该在代码里加入对目录的判定
具体代码如下
#-*-coding:utf-8-*-
#coding=utf-8
importos
ul=r"E:/tensorflow/初赛训练数据/test/callreason"
folder=os.path.exists(ul)
ifnotfolder:#判断是否存在文件夹如果不存在则创建为文件夹
os.makedirs(ul)
filenamelist=os.listdir(ul)
foryinrange(len(filenamelist)):
f=open(ul+'/'+filenamelist[y],"r",encoding='utf-8')
modname=f.readline()
f.close()
newurl=ul+"/"+modname[:-1]+".txt"
os.rename(os.path.join(ul,filenamelist[y]),newurl)
print("执行成功")
执行结果<注意红色框里的代码,这就是需要你加入的代码,用于判断目录是否存在>:
D. Python3读取大文件的方法
1.方法一:利用yield生成器
2. 方法二:利用open()自带方法生成迭代对象,这个是早租一行一行的读取
总结:二者的比较
方法一:可以灵活控制一次读取的size,在速度上较2有优势,适用于一些大的和睁盯二进制文件,比如读取一些大的视频或者图片等。
方法二:在处理一唤和些文本的时候感觉更加便利,按行读更容易对文本进行处理。
E. python3在文件夹中查找指定文件方法封装
不是人人都能活的低调,可以低调的基础是随时都能高调。
上一篇: configobj读写.ini配置文件方法封装
下一篇: python3使用hmac、hashlib加密字符串方法封装
本篇文章介绍一种方法在文件夹中查找指定文件:
1、方法【get_all_file】:根据给出的路径进行递归,找到文件夹下所有的文件,以生成器的方式返回(占用内存低),也可以添加到列表(list)(占用内存高)。
2、方法【expand_list】:递归嵌套列表,展开列表,此步骤根据数据结构,如果自己的文件的地址是多层嵌套的列表,可以使用该方法展开列表。
3、方法【find_file】:查找指定文件。
以上方法根据自己的需求进行选择使用,有不足的地方,请各位大佬指出。
如果感觉本文对您有帮助可以点个赞哦
本文仅供交流学习,请勿用于非法途径
仅是个人意见,如有想法,欢迎留言