Python二进制文件读取
❶ python二进制文件的读取与写入可以分别使用 和 方法
可以使用read方法和readline方法
❷ python 二进制读取文件 如何知道真实的读取字节大小
read(100)读取的结果保存在buff,buff是字节类型
用len(buff)可以返回读取字节的实际长度。
❸ python 怎样读取visual c++二进制文件格式
1.python 二进制文件的读写
只讨论二进制文件的读写。
以二进制的形式打开文件
with open(filename , 'wb') as fd :
#do with fd
fd.write(strobject)#二进制strobject写入文件
fd.read(byte_len)#读取byte_len字节数据
wb:表示以二进制写的方式打开文件
rb :表示以二进制读的方式打开文件
2.关于进制的转换
需要使用到struct进行打包成二进制字符串或者相应的解包成元组。
#根据format形式,把后面的变量v1,v2,...打包成字节对象形式
byte_objects = struct.pack(format,v1,v2,...)
#根据format形式,从buffer中解包出数据,返回值的形式是元组
value_tuple = struct.unpack(format,buffer)
3.读写几种数据类型的例子
#写入文件
with open('test.data','wb') as fd:
i = 1
bi = struct.pack('i',i) #'i'表示对int类型进行打包
fd.write(bi)
f = 2.1
bf = struct.pack('f',f) #'f'表示对float类型进行打包
fd.write(bf)
d = 3.1
bd = struct.pack('d',d) #'d'表示对double类型进行打包
fd.write(bd)
l = 4L
bl = struct.pack('l',l)#'l'表示对long类型进行打包
fd.write(bl)
#读取文件
with open('test.data','rb') as fd:
byte_len = 4
bi = fd.read(byte_len) #读取int类型的4个字节的二进制数据
print struct.unpack('i',bi) #解压成原来的int类型
bf = fd.read(byte_len) #读取float类型的4个字节的二进制数据
print struct.unpack('f',bf) #解压成原来的float类型
byte_len = 8
bd = fd.read(byte_len) #读取double类型的8个字节的二进制数据
print struct.unpack('d',bd) #解压成原来的double类型
bl = fd.read(byte_len) #读取long类型的8个字节的二进制数据
print struct.unpack('l',bl)#解压成原来的long类型
关于C/C++里面的数据类型在Python里面对应的数据类型以及占用的字节大小,参考下面的网站。
https://docs.python.org/3/library/struct.html#format-characters
4.测试关于c++读去python生成的文件
/**c++ ifstream**/
void readifstream(const char* filename){
cout << "ifstream " << endl;
ifstream ifs(filename,ifstream::binary);
if(!ifs){
cerr << "open file error " << endl;
exit(0);
}
int i;
float f;
double d;
long l;
ifs.read((char*)&i,sizeof(i));
ifs.read((char*)&f,sizeof(f));
ifs.read((char*)&d,sizeof(d));
ifs.read((char*)&l,sizeof(l));
ifs.close();
cout <<"i="<< i << " f="<< f <<" d="<< d <<" l=" << l << endl;
cout << "==============cout======================" << endl;
}
/**c FILE*/
void readFILE(const char* filename){
printf("readFILE\n");
FILE * fid = fopen(filename,"rb");
if(!fid){
perror("open file error \n");
exit(0);
}
const int size = 1;
int i;
float f;
double d;
long l;
fread((char*)&i,sizeof(i),size,fid);
fread((char*)&f,sizeof(f),size,fid);
fread((char*)&d,sizeof(d),size,fid);
fread((char*)&l,sizeof(l),size,fid);
fclose(fid);
printf("i=%d f=%.2f d=%.2lf l=%ld\n",i,f,d,l);
printf( "================printf====================\n");
}
❹ 利用python读写二进制文件
思路:首先写入一个矩阵到二进制文件中,然后读取二进制文件恢复到另外一个矩阵中。
(推荐教程:python基础教程)
具体代码实现:
相关推荐:python爬虫视频教程
❺ python3二进制文件读写直接加b不行吗
二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes类型读写的,因此获得的是一个bytes对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型,确保为bytes类型。
s = 'this is a test'
b = bytes(s,encoding='utf-8')
f = open('test.txt','w')
f.write(s)
##这样没问题,正常写入了文件。
##-------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')
f = open('test.txt','wb') ##注意多了个b
f.write(s)
##报错
TypeError: a bytes-like object is required, not 'str'
##意思是它需要一个bytes类型数据,你却给了个字符串
##---------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')
f = open('test.txt','wb') ##注意多了个b
f.write(b) ##将变量b传给它,b是个bytes类型
二、 + 模式:
对于w+模式,在读写之前都会清空文件的内容,建议不要使用!
对于a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!
对于r+模式,也就是读写模式,配合seek()和tell()方法,可以实现更多操作。
三、 编码问题
要读取非UTF-8编码的文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:
>>> f = open('gbk.txt', 'r', encoding='gbk')
>>> f.read()
'GBK'
遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如何处理。
>>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')
四、 文件对象操作
每当我们用open方法打开一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。下面假设,已经打开了一个f文件对象。
1. f.read(size)
读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。
f = open("1.txt", "r")
str = f.read()
print(str)
f.close()
如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(512)这种一点一点的读。
2. f.readline()
从文件中读取一行n内容。换行符为' '。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。
f = open("1.txt", "r")
str = f.readline()
print(str)
f.close()
3. f.readlines()
将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。
f = open("1.txt", "r")
a = f.readlines()
print(a)
f.close()
4. 遍历文件
实际上,更多的时候,我们将文件对象作为一个迭代器来使用。
# 打开一个文件
f = open("1.txt", "r")
for line in f:
print(line, end='')
# 关闭打开的文件
f.close()
这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline方法一样只能前进,不能回退。
几种不同的读取和遍历文件的方法比较:如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便。普通情况,使用for循环更好,速度更快。
5. f.write()
将字符串或bytes类型的数据写入文件内。write()动作可以多次重复进行,其实都是在内存中的操作,并不会立刻写回硬盘,直到执行close()方法后,才会将所有的写入操作反映到硬盘上。在这过程中,如果想将内存中的修改,立刻保存到硬盘上,可以使用f.flush()方法,但这可能造成数据的不一致。
# 打开一个文件
f = open("/tmp/foo.txt", "w")
f.write("Python 是一种非常好的语言。
我喜欢Python!!
")
# 关闭打开的文件
f.close()
6. f.tell()
返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。
7. f.seek()
如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。
from_what的值,如果是0表示从文件开头计算,如果是1表示从文件读写指针的当前位置开始计算,2表示从文件的结尾开始计算,默认为0,例如:
offset:表示偏移量。
seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
seek(x,1) : 表示从当前位置往后移动x个字符
seek(-x,2):表示从文件的结尾往前移动x个字符
看一个例子:
>>> f = open("d:\1.txt", "rb+")
>>> f.write(b"1232312adsfalafds")
17
>>> f.tell()
17
>>> f.seek(5)
5
>>> f.read(1)
b'1'
>>> f.seek(-3, 2)
14
>>> f.read(1)
b'f'
8. f.close()
关闭文件对象。当处理完一个文件后,调用f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了,或者更糟糕的结果。也就是说大象塞进冰箱后,一定不要忘记关上冰箱的门。
❻ python读取C#写的二进制文件,byte类型unpack
近期有一部分早期记录数据,C#写的二进制数据,在读取的过程中,short和unshort类型还是比较好转换的,但是碰到byte类型,对照struct的说明是x,设置读取格式时,这部分会空出来,读不出来。查看说明C#的byte类型在python是no value,用x读不出来。因为大概知道数据是整数类型的,于是用b(与B区别,是否有负值),也是1个字节,和C#中的byte一样长度,可以正确显示出来数据。如果是字符类,可以考虑c,s,p。注意变量所占字节数。(读出来数据最好测试验证一下)。
def readWrite(fname):
with open(fname,'rb') as f:
if fname[-3:] == 'RPT' : #文件格式是RPT格式的二进制文件
data = f.read()
#fmt = 'H16x2H4x2H10x5H2h6H' #数据格式中x会导致数据忽略掉,读不出来
fmt = 'H16b2H4b2H10b5H2h6H' #采用b替换后,数据格式显示正常
data1= struct.unpack(fmt,data)
elif fname[-3:] == 'DAY': #文件格式时DAY格式的二进制文件
data = f.read()
fmt = '4i'
data1= struct.unpack(fmt,data)
else:
data1 = '不是指定文件或文件错误'
print('不是指定文件')
return data1
❼ python pdf二进制读取问题
可以使用numpy.fromfile(),也可以使用open(filename, 'rb'),其中的'b'就是二进制的意思,然后使用文件类型的read方法,读取一些字节,再用struct.unpack()方法来解析二进制。
第一种方法是一次性读入文件(或文件的前多少个连续字节)到一个数组中,因此,灵活性差。
第二种方法灵活性很高,可以读取任意位置(使用文件的seek()方法跳跃位置)的二进制数据,再使用struct.unpack()方法来进行各种二进制解析。
提示:二进制文件是不保留存储方式的数据格式,因此,读二进制文件时应该知道二进制文件的存储格式。
❽ 在python中如何从二进制文件中读取信息
你是指读入二进制文件吧?
可以使用numpy.fromfile(),也可以使用open(filename, 'rb'),其中的'b'就是二进制的意思,然后使用文件类型的read方法,读取一些字节,再用struct.unpack()方法来解析二进制。
第一种方法是一次性读入文件(或文件的前多少个连续字节)到一个数组中,因此,灵活性差。
第二种方法灵活性很高,可以读取任意位置(使用文件的seek()方法跳跃位置)的二进制数据,再使用struct.unpack()方法来进行各种二进制解析。
提示:二进制文件是不保留存储方式的数据格式,因此,读二进制文件时应该知道二进制文件的存储格式。