python提取段落
發布時間: 2025-02-23 05:26:27
Ⅰ 如何用python爬取數據
方法/步驟
在做爬取數據之前,你需要下載安裝兩個東西,一個是urllib,另外一個是python-docx。
7
這個爬下來的是源代碼,如果還需要篩選的話需要自己去添加各種正則表達式。
Ⅱ python 怎麼實現簡歷信息抽取
安裝讀取word文檔的第三方模塊:
pip install python-docx
#coding=utf-8
讀取的例子:
fromdocximportDocument
#打開文檔
document=Document(u'簡歷.docx')
#取出段落
l=[paragraph.text.encode('gb2312')
#取出表格
forparagraphindocument.paragraphs]:
foriinl:
printi
tables=[tablefortableindocument.tables]
fortableintables:
嘩游正for磨運rowintable.rows:
forcellinrow.cells:
亂悔print('%s '%cell.text.encode('gb2312'))
至於讀取後你要做什麼,就自己定製吧。
熱點內容