python数据格式转换
Ⅰ python 对Excel表格文件的类型自由转换
如上所示,FileFormat为51,表示文件格式为xlsx。
下面还列出了需要常用的excel文件格式,供大家参考:
此外,如果还需要转其他文件格式,可参考微软官网提供的文件格式
Ⅱ Python类型可以转为JSON的number类型
python数据类型转化为JSON格式的数据有两种方式。
第一种方式是,mps(dict1)是将python数据类型转化为JSON类型的字符串string,mp(dict1,sp)将python数据类型转化为文件流,sp表示写入文件的路径。第二种方式是通过mps转化成字符串,然后再写入。
JSON格式的数据也可以转化为python数据类型。loads(str)将JSON字符串转化成python类型的数据,在使用loads操作字符串load(str,fp)将后缀为json文件转化成python格式的数据,load操作文件流。因为文件读写操作时有可能产生IOError,一旦出错,后面的close方法就不能执行到,为了保证是否出错都能关闭文件,使用withopen文件操作流。
Ⅲ 利用Python将GB格式序列文件 转换成 Fasta格式文件
在分子生物学中 我们会有将GB格式序列文件 转换成 Fasta格式文件的需求,这里我们利用python脚本来解决这个问题。
gb格式文件是GenBank的文件,用来保存序列的详细信息。包含一个gene的名称,编号,发现者,参考文献,外显子位置,编码区序列,蛋白序列等等信息。
例如:
fasta格式是一种基于文本用于表示核酸序列或 多肽 序列的格式。其中 核酸 或 氨基酸 均以单个字母来表示,且允许在序列前添加序列名及注释。该格式已成为 生物信息学 领域的一项标准。
例如:
程序运行前 D:\docu\gb2fasta\ 文件夹下 文件
程序运行后 D:\docu\gb2fasta\ 文件夹下 文件
程序运行后 D:\docu\gb2fasta\ singl_fasta\ 文件夹下 文件
Ⅳ 利用python将docx文件转为txt
背景:工作中需要将文件夹下的若干word文件docx转换为对应txt文本格式
因此需要将docx中文本读取出来,然后保存为txt格式即可
需要的python模块为 python-docx : https://python-docx.readthedocs.io/en/latest/index.html, 导入模块时候导入docx
(只能读取.docx文件,不能读取.doc文件)
注意,在PyPi里还有一个叫docx的库,已经停止更新,不建议使用)
http://www.cnblogs.com/geek-arking/p/9300617.html
上面的方法只能读取docx文件,如果读取doc会报错
结果报错:docx.opc.exceptions.PackageNotFoundError: Package not found。还是无法识别doc
“改变拓展名并没有改变其编码方式,因此无法读取文本内容,需将doc文件用word另存为docx后再用python-docx读取其内容”
对于要转换的doc文件,网上的资料都是使用win32,需要安装 pypiwin32
https://www.cnblogs.com/AlgorithmDot/p/3386918.html
通过上面的方法,有时可以直接将doc转换为txt文件,有时候会报错。
这里我们可以考虑将doc文件直接转换为docx然后再通过上面的方法读取为txt,如果手动将doc修改为txt或者docx,打开文件会显示乱码,但是可以用其提供的SaveAs方法将.doc文档利用手动的方式“另存为”.docx文档,就能够成功打开转化后的.docx文档,
doc.SaveAs(tmp +'.docx', 16)
其中16的含义如下:
利用win32com接口直接调用office API,好处是简单、兼容性好,只要office能处理的,python都可以处理,处理出来的结果和office word里面“另存为”一致。
下面是office 2007支持的全部文件格式对应表:
wdFormatDocument = 0
wdFormatDocument97 = 0
wdFormatDocumentDefault = 16
wdFormatDOSText = 4
wdFormatDOSTextLineBreaks = 5
wdFormatEncodedText = 7
wdFormatFilteredHTML = 10
wdFormatFlatXML = 19
wdFormatFlatXMLMacroEnabled = 20
wdFormatFlatXMLTemplate = 21
= 22
wdFormatHTML = 8
wdFormatPDF = 17
wdFormatRTF = 6
wdFormatTemplate = 1
wdFormatTemplate97 = 1
wdFormatText = 2
wdFormatTextLineBreaks = 3
wdFormatUnicodeText = 7
wdFormatWebArchive = 9
wdFormatXML = 11
wdFormatXMLDocument = 12
= 13
wdFormatXMLTemplate = 14
= 15
wdFormatXPS = 18
照着字面意思应该能对应到相应的文件格式。
1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档
2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。
doc.save(path_or_stream)
3、对象集合。python-docx包含了word文档的相关对象集合。
4、插入段落。段落是word最基本的对象之一。
5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。
6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。
#插入一个空白段落
p = doc.add_paragraph('')
p.add_run('123', style="Heading 1 Char")
p.add_run('456')
p.add_run('789', style="Heading 2 Char")
#这样一个段落就应用了两个字符样式,中间“456”就没应用样式
printp.text#输出结果是u'123456789' 也还是连续的
7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。
p = doc.add_paragraph('')
r = p.add_run('123')
r.font.bold =True#加粗
r.font.italic =True#倾斜 等等...
8、表格操作。表格也是经常用到的一种对象类型。
Ⅳ python可以实现批量的格式转换吗
可以啊,你要什么格式转什么格式啊?
一般来说同类型转换的化只需要导入一个库就可以了,要是不同类型的,估计可能就需要自己编写代码进行转化了,比如将binary mask(二进制)图像转化为json文件之类的,那就需要自己编写函数了,要是mp4转avi这种直接调用库就可以完成;要是直接改后缀名的话,几行代码就可以。
Ⅵ python语言format用法
Format为CString类的一个成员函数,它通过格式操作使任意类型的数据转换成一个字符串Format里面可以写普通的字符串,比如“mynameis”,但有些格式指令字符具有特殊意义,比如“%6s”。
Format(<表达式>[,<格式字符串>])其中,<表达式>:要格式化的数值、日期或字符串表达式。<格式字符串>:指定表达式的值的输出格式。格式字符有三类:数值格式、日期格式和字符串格式。格式字符要加引号。
方法如下:
1、首先按下“Win+R”组合键,打开运行窗口。
Ⅶ 如何用python把pdf转为cad
1.准备一款专业的CAD转换器,如果你的电脑里有可以直接打开。
2.打开运行软件,在软件界面的左侧我们找到“PDF转CAD”功能。
3.选择好了转换类型,接下来就是添加文件,添加文件有两个方法,一个是点击界面中的“添加文件”,一个是直接把你的文件拖到软件的指定区域;
4.文件添加好后,要是需要自定义选择转换后文件储存的位置选择“浏览”按钮,选择好储存位置便可。
5.转换界面可以进行转换后文件格式的选择,有“DWG、DXF”两种格式进行选择,可以根据自己的需求选择输出格式。
6.击“批量转换”按钮开始文件的转换,当所有的文件转换状态为百分百的时候就说明文件转换完成了。
Ⅷ python怎么实现文件格式的转换
1. 如果是文档类转换的话, 可以借助 pypandoc模块(pip install pypandoc)
importpypandoc
out=pypandoc.convert_file('a.txt','docx',outputfile='a.docx')#转为docx
2. 如果是图片或者视频类的转化的话, 可以使用 opencv
importcv2
img=cv2.imread('a.jpg')
out=cv2.imwrite('a.png',img)#jpg转png
Ⅸ python基础问题,数据转换
x = []
y = []
for item in result:
x.append(item[0])
y.append(item[1])
print(x, y)
运行效果
希望对您有所帮助!
Ⅹ python中提供的数据类型转换函数有哪些,作用是什么
作用就是把合理的数据转换为需要的类型。int()整数,float()浮点数,str()字符串,list()列表,tuple()元组,set()集合……
比如a='12'这个是字符串类型,用int函数a=int(a)这时变量a就是整型,字符串'12'变为了整数12。Python没有变量声明的要求,变量的属性在赋值时确定,这样变量的类型就很灵活。
有一种题目判断一个整数是否回文数,用字符串来处理就很简单
a=1234321#整数
if str(a)==str(a)[::-1]:#借助字符串反转比较就可以确定是否回文数。
还比如元组b=(1,3,2,4),元组是不可以更新删除排序成员的,但是列表是可以的,通过列表函数进行转换来实现元组的更新删除和排序。
b=(1,3,2,4)
b=list(b)
b.sort()
b=tuple(b)
这时得到的元组b就是一个升序的元组(1,2,3,4)
再比如你要输入创建整数列表或者整数元组基本上写法相同,就是用对应的函数来最后处理。
ls=list(map(int,input().split()))#这个就是列表
tup=tuple(map(int,input().split()))#这个就是元组
再比如有个叫集合的,集合有唯一性,可以方便用来去重。
ls=[1,2,3,1,2,3,1,2,3]
ls=list(set(ls))#通过set()去重后,现在的ls里就是[1,2,3]去重后的列表。