python提取段落
发布时间: 2025-02-23 05:26:27
Ⅰ 如何用python爬取数据
方法/步骤
在做爬取数据之前,你需要下载安装两个东西,一个是urllib,另外一个是python-docx。
7
这个爬下来的是源代码,如果还需要筛选的话需要自己去添加各种正则表达式。
Ⅱ python 怎么实现简历信息抽取
安装读取word文档的第三方模块:
pip install python-docx
#coding=utf-8
读取的例子:
fromdocximportDocument
#打开文档
document=Document(u'简历.docx')
#取出段落
l=[paragraph.text.encode('gb2312')
#取出表格
forparagraphindocument.paragraphs]:
foriinl:
printi
tables=[tablefortableindocument.tables]
fortableintables:
哗游正for磨运rowintable.rows:
forcellinrow.cells:
乱悔print('%s '%cell.text.encode('gb2312'))
至于读取后你要做什么,就自己定制吧。
热点内容