python正则文件
㈠ 如何使用 python 正则表达式解析文本文件
试试这个方法:import re
def get_email_list(text):
pattern = re.compile(r'\b[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}\b')
email_list = re.findall(pattern, text)
return email_list
print get_email_list(your_text)
㈡ python正则表达式是什么
python正则表达式是使用单个字符串来描述、匹配某个句法规则的字符串,常被用来检索、替换那些符合某个模式(规则)的文本。最初的正则表达式出现于理论计算机科学的自动控制理论和形式化语言理论中。
1950 年,数学家斯蒂芬·科尔·克莱尼利用称之为“正则集合”的数学符号来描述此模型。肯·汤普逊将此符号系统引入编辑器 QED,随后是 UNIX 上的编辑器 ed,并最终引入 grep。自此以后,正则表达式被广泛地应用于各种 UNIX 或类 UNIX 系统的工具中。目前,许多程序设计语言都支持利用正则表达式进行字符串操作。
正则表达式常用的特殊字符:
:将下一个字符标记为一个特殊字符、一个原义字符(Identity Escape,有 "^" "$" "(" ")" "*" "+" "{" "|" 共计12个)、一个向后引用(backreferences)或一个八进制转义符。例如“n”匹配字符“n”,“ ”匹配一个换行符,“\”匹配“”,“(”则匹配“(”。
^:匹配输入字符串的开始位置。如果设置了正则表达式的多行属性,“^”也可以匹配“ ”或“ ”之 后的位置。
[a-z]:字符范围,匹配指定范围内的任意字符。例如“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。
s:匹配任何空白字符,包括空格、制表符、换页符等,等效于“[f v]”。注意 Unicode 正则表达式 会匹配全角空格符。
㈢ Python如何正则表达式匹配固定搭配的文本文件名文件名
abc-bh(?:\.\d+)+\.txt
㈣ python正则表达式
px=r'<tr>.+?<a.+?title=(.+?)"href="<%=.+?%>.*??filename=<%=.+?("(.+?)",".+?")%>">.+?</a>.+?<td.+?>(.+?)</td>.+?</tr>'
rex=re.compile(px,re.S|re.M)
mth=rex.findall(txt)
forlinmth:
printl[0].decode('utf-8'),l[1].decode('utf-8'),l[2].decode('utf-8')
其中字符串变量txt里存网页源码。
㈤ python 正则匹配
用python正则表达式可以做到,因为点在正则表达式中可以代表任意字符(除回车换行符外)
正则表达式 (-?d+). 替换成 1 (1表示第一捕获组的数据)
完整的Python程序如下
importre
s='-111•485503•剩余部分'
regex=r'(-?d+).'
result=re.sub(regex,r"1 ",s)
print(result)
㈥ python 正则表达式
这个用Python正则表达式应该这么写(见图中程序)
㈦ python正则
pic = requests.get(each)是发送请求到服务器,服务器返回(图片)的二进制数据流, fp.write(pic.content)就是把图片的二进制数据存到本地文件,也就是保存图片
㈧ 如何在python中用正则表达式批量修改文件名
importre
importos
defget_file_list(folder):
file_list=[];
forroot,dirs,filesinos.walk(folder):
forfinfiles:
path=root+os.path.sep+f
file_list.append(path)
returnfile_list
defget_re_file_list(file_list,re_rule):
file_list_re=[]
forfileinfile_list:
ifre.search(re_rule,file):
file_list_re.append(file)
returnfile_list_re
defrename2new_file_list(file_list_re,re_rule,new_str):
re_c=re.compile(re_rule)
new_file_list=[]
foriinrange(0,len(file_list)):
new_base_name=re_c.sub(new_str,file_list[i][file_list[i].rindex(os.sep):])
new_full_path=file_list_re[i][:file_list_re[i].rindex(os.sep))+os.sep+base_name
new_file_list.append(new_full_path)
returnnew_file_list
defrename2list(old_list,new_list):
foriinrange(0,len(old_list)):
os.rename(old_list[i],new_list[i])
defmain():
root=""
re_rule=""
new_str=""
old_file_list=get_file_list(root)
re_file_list=(old_file_list,re_rule)
new_file_list=rename2new_file_list(re_file_list,re_rule,new_str)
rename2list(re_file_list,new_file_list)
if__name__=='__main__'
main()
㈨ python 正则
p = re.compile(r'<th class="subject new">(.*?)</th>',re.S)
不要继续问为什么, 去查python手册.
还有一个小提示,不建议用str作变量名, 因为str是python内建的一个类
㈩ python正则表达式是什么呢
python正则表达式如下:
在python中,所谓的“正则表达式”指的是通常被用来检索、替换那些符合某个模式的一段文本。具体而言,它的作用是检测某个字符串是否符合规则和提取网页字符串中想要的数据。
正则表达式是对字符串提取的一套规则,我们把这个规则用正则里面的特定语法表达出来,去匹配满足这个规则的字符串。正则表达式具有通用型,不仅python里面可以用,其他的语言也一样适用。
python的编程特点:
速度快:Python的底层是用C语言写的,很多标准库和第三方库也都是用C写的,运行速度非常快。
免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。
高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。
解释性:一个用编译性语言比如C或C++写的程序可以从源文件(即C或C++语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程通过编译器和不同的标记、选项完成。