当前位置:首页 » 编程语言 » python以二进制打开文件

python以二进制打开文件

发布时间: 2023-06-11 01:09:39

1. python 文件的打开与读写

/python通过解释器内置的open()函数打开一个文件,并实现该文件与一个程序变量的关联,open()函数格式如下:

/open()函数包含有两个参数:文件名和打开模式.当文件与执行文件在同一大厅文件夹中,直接输入文件名,亦可输入文件的完整路径.打开模式是指以何种方式打开文件,python提供了7种打开模式.

/r/w/x/a模式与b/t/+模式可以组合使悉仿悄用,比如'rt'为文睁渣本只读.'rb'为二级制只读.

/文件使用结束后,需要使用close()关闭文件使用权限,释放内存.

/当文件使用文本格式打开时,读写按照字符串方式,采用计算机当前编码或指定编码.
/当文件以二进制方式打开时,读写按照字节流方式.

/python本身将文件读取为一个行序列.

2. Python文件操作,看这篇就足够!

文件的存储方式

在计算机中,文件是以二进制的方式保存在磁盘上的文本文件和二进制文件

文本文件可以使用文本编辑软件查看本质上还是二进制文件

二进制文件保存的内容不是给人直接阅读的,而是提供给其她软件使用的二进制文件不能使用文件编辑软件查看

文件基本操作

在计算机中要操作文件一共包含三个步骤:1.打开文件2.读、写文件

读 将文件内容读入内容写 将内存内容写入文件

模式描述

t文本模式 (默认)。

x写模式,新建一个文件,如果该文件已存在则会报错。

b二进制模式。

+打开一个文件进行更新(可读可写)。

U通用换行模式(不推荐)。

r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。

r+打开一个文件用于读写。文件指针将会放在文件的开头。

rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。

w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。

w+打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb+以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。

a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

文件打开模式有很多,但是我们实际用到的就只有六种。

我们总结一下主要用到的是下面六种

模式可做操作若文件不存在是否覆盖文件原来内容

r只读报错——

r+可读、可写报错是

w只写创建是

w+可读、可写创建是

a只写创建否,追加写

a+可读、可写创建否,追加写

只读模式打开文件——只读(r)

文件若不存在报错:

读写模式打开文件——读写模式(r+)

数据写入之前:

数据写入之后:

会替换掉相同长度的内容

文件若不存在报错:

写模式打开文件——写模式(w)

数据写入之前:

数据写入之后:

这种操作会删除原来的文件内容,重新写入Python,

并且把光标放在文件最开始。

若文件不存在,系统会创建该文件夹并重新写入内容

读写模式打开文件——读写模式(w+)

数据写入之前:

数据写入之后:

这种操作会删除原来的文件内容,重新写入Python,

并且把光标放在文件最开始。

若文件不存在,系统会创建该文件夹并重新写入内容

利用这个原理所以文件写模式(w)、读写模式(w+)还可以用作删除文件内容。

因为他们整个工作原理就是把文件原来的内容删除,然后写入新的内容。

如果我们写入的内容为空,那么不就是删除文件内容。

数据写入之前:

数据写入之后:

写模式打开文件(追加内容)——写模式(a)

数据写入之前:

数据写入之后:

可以看到是在原先内容的基础上在文末追加新的内容!

若文件不存在,系统会创建新的文件夹并写入内容

读写模式打开文件(追加内容)——读写模式(a)

数据写入之前:

数据写入之后:

可以看到是在原先内容的基础上在文末追加新的内容!

若文件不存在,系统会创建新的文件夹并写入内容

二进制模式打开文件

我们看到了在文件打开模式中有以下模式:rb、wb……有这种带 b 的。

什么意思呢?

就是用二进制的方式打开文件。

很明显,我们出现了以下错误:

主要原因是因为编码的问题,可能是因为0x82这个字节在gbk编码中没有这个字符,

可能原字符是两个字节,在gbk里被解析成了一个字节,导致字符不存在。

这就是我们文件打开方式需要使用二进制读取的原因。

文件操作

open 函数负责打开文件,并且返回文件对象

read /write / close 三个方法都需要通过文件对象 来调用

文件和文件夹的操作

在Python中⽂件和⽂件夹的操作要借助os模块⾥⾯的相关功能,

具体步骤如下:

导⼊os模块

使⽤ os 模块相关功能

1、文件重命名

2、删除文件

3、创建文件夹

4、删除文件夹

5、获取当前目录

6、改变默认目录

7、获取目录列表

3. 如何用python生成和读取二进制文件

withopen('a.jpg','rb')asf:
s=f.read()
withopen('b.exe','wb')asf:
f.write(s)

4. 利用python读写二进制文件

思路:首先写入一个矩阵到二进制文件中,然后读取二进制文件恢复到另外一个矩阵中。
(推荐教程:python基础教程)
具体代码实现:
相关推荐:python爬虫视频教程

5. python读取C#写的二进制文件,byte类型unpack

        近期有一部分早期记录数据,C#写的二进制数据,在读取的过程中,short和unshort类型还是比较好转换的,但是碰到byte类型,对照struct的说明是x,设置读取格式时,这部分会空出来,读不出来。查看说明C#的byte类型在python是no value,用x读不出来。因为大概知道数据是整数类型的,于是用b(与B区别,是否有负值),也是1个字节,和C#中的byte一样长度,可以正确显示出来数据。如果是字符类,可以考虑c,s,p。注意变量所占字节数。(读出来数据最好测试验证一下)。

def readWrite(fname):

    with open(fname,'rb') as f:

        if fname[-3:] == 'RPT' :    #文件格式是RPT格式的二进制文件

            data = f.read()

           #fmt = 'H16x2H4x2H10x5H2h6H'   #数据格式中x会导致数据忽略掉,读不出来

           fmt = 'H16b2H4b2H10b5H2h6H'   #采用b替换后,数据格式显示正常

            data1= struct.unpack(fmt,data)

        elif fname[-3:] == 'DAY':     #文件格式时DAY格式的二进制文件

            data = f.read()

            fmt = '4i'

            data1= struct.unpack(fmt,data)

        else:

            data1 = '不是指定文件或文件错误'

            print('不是指定文件')

    return data1

6. python3二进制文件读写直接加b不行吗

二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes类型读写的,因此获得的是一个bytes对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型,确保为bytes类型。

s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','w')
f.write(s)

##这样没问题,正常写入了文件。

##-------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','wb') ##注意多了个b
f.write(s)

##报错
TypeError: a bytes-like object is required, not 'str'
##意思是它需要一个bytes类型数据,你却给了个字符串

##---------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','wb') ##注意多了个b
f.write(b) ##将变量b传给它,b是个bytes类型
二、 + 模式:
对于w+模式,在读写之前都会清空文件的内容,建议不要使用!

对于a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!

对于r+模式,也就是读写模式,配合seek()和tell()方法,可以实现更多操作。

三、 编码问题
要读取非UTF-8编码的文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:

>>> f = open('gbk.txt', 'r', encoding='gbk')
>>> f.read()
'GBK'
遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如何处理。

>>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')
四、 文件对象操作
每当我们用open方法打开一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。下面假设,已经打开了一个f文件对象。

1. f.read(size)
读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

f = open("1.txt", "r")

str = f.read()
print(str)

f.close()
如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(512)这种一点一点的读。

2. f.readline()
从文件中读取一行n内容。换行符为' '。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。

f = open("1.txt", "r")
str = f.readline()
print(str)
f.close()
3. f.readlines()
将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。

f = open("1.txt", "r")
a = f.readlines()
print(a)
f.close()
4. 遍历文件
实际上,更多的时候,我们将文件对象作为一个迭代器来使用。

# 打开一个文件
f = open("1.txt", "r")

for line in f:
print(line, end='')

# 关闭打开的文件
f.close()
这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline方法一样只能前进,不能回退。

几种不同的读取和遍历文件的方法比较:如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便。普通情况,使用for循环更好,速度更快。

5. f.write()
将字符串或bytes类型的数据写入文件内。write()动作可以多次重复进行,其实都是在内存中的操作,并不会立刻写回硬盘,直到执行close()方法后,才会将所有的写入操作反映到硬盘上。在这过程中,如果想将内存中的修改,立刻保存到硬盘上,可以使用f.flush()方法,但这可能造成数据的不一致。

# 打开一个文件
f = open("/tmp/foo.txt", "w")

f.write("Python 是一种非常好的语言。
我喜欢Python!!
")

# 关闭打开的文件
f.close()
6. f.tell()
返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。

7. f.seek()
如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值,如果是0表示从文件开头计算,如果是1表示从文件读写指针的当前位置开始计算,2表示从文件的结尾开始计算,默认为0,例如:

offset:表示偏移量。

seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
seek(x,1) : 表示从当前位置往后移动x个字符
seek(-x,2):表示从文件的结尾往前移动x个字符
看一个例子:

>>> f = open("d:\1.txt", "rb+")
>>> f.write(b"1232312adsfalafds")
17
>>> f.tell()
17
>>> f.seek(5)
5
>>> f.read(1)
b'1'
>>> f.seek(-3, 2)
14
>>> f.read(1)
b'f'
8. f.close()
关闭文件对象。当处理完一个文件后,调用f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了,或者更糟糕的结果。也就是说大象塞进冰箱后,一定不要忘记关上冰箱的门。

7. python pdf二进制读取问题

可以使用numpy.fromfile(),也可以使用open(filename, 'rb'),其中的'b'就是二进制的意思,然后使用文件类型的read方法,读取一些字节,再用struct.unpack()方法来解析二进制。
第一种方法是一次性读入文件(或文件的前多少个连续字节)到一个数组中,因此,灵活性差。
第二种方法灵活性很高,可以读取任意位置(使用文件的seek()方法跳跃位置)的二进制数据,再使用struct.unpack()方法来进行各种二进制解析。

提示:二进制文件是不保留存储方式的数据格式,因此,读二进制文件时应该知道二进制文件的存储格式。

8. python查看linux执行二进制文件的源代码

python查看linux执行二进制文件的源代码的步骤如基袭下。
1、打开终端,使用cd命令进入存放搏巧兄二进制文件的目录。
2、执行命令,将二宽弊进制文件转换成汇编代码:binary_file是要查看的二进制文件名,output_file是转换后的汇编代码输出到的文件名。
3、打开output_file文件,阅读其中的汇编代码即可了解二进制文件的运行机制和实现原理。

热点内容
苹果怎么对备忘录加密码 发布:2025-02-13 18:44:19 浏览:72
php房产网 发布:2025-02-13 18:18:06 浏览:86
源码资源吧 发布:2025-02-13 18:14:39 浏览:80
java培训价钱 发布:2025-02-13 17:59:33 浏览:975
c语言中变量类型 发布:2025-02-13 17:52:20 浏览:259
ftp导出报错 发布:2025-02-13 17:41:20 浏览:998
脚本下载教程 发布:2025-02-13 17:39:06 浏览:236
解压密码re 发布:2025-02-13 17:39:02 浏览:559
linuxdump内存 发布:2025-02-13 17:37:30 浏览:58
游戏客户端源码 发布:2025-02-13 17:37:19 浏览:595