python正则匹配任意字符
⑴ python涓姝e垯琛ㄨ揪寮忕殑甯哥敤鍏冨瓧绗︽湁鍝浜涘憿锛
Python 涓甯哥敤镄勬e垯琛ㄨ揪寮忓厓瀛楃﹀寘𨰾锛
.锛氩尮閰崭换镒忎竴涓瀛楃︼纸闄や简鎹㈣岀 锛夈
^锛氩尮閰嶅瓧绗︿覆镄勫紑澶淬
$锛氩尮閰嶅瓧绗︿覆镄勭粨灏俱
*锛氩尮閰嶅墠闱㈢殑瀛楃 0 娆℃垨澶氭°
+锛氩尮閰嶅墠闱㈢殑瀛楃 1 娆℃垨澶氭°
?锛氩尮閰嶅墠闱㈢殑瀛楃 0 娆℃垨 1 娆°
{n}锛氩尮閰嶅墠闱㈢殑瀛楃︽伆濂 n 娆°
{m,n}锛氩尮閰嶅墠闱㈢殑瀛楃﹁呖灏 m 娆★纴镊冲 n 娆°
[]锛氩尮閰嶆柟𨰾鍙峰唴镄勪换镒忎竴涓瀛楃︺
()锛氭爣璁颁竴涓瀛愯〃杈惧纺镄勫紑濮嫔拰缁撴潫浣岖疆銆
|锛氲〃绀烘垨锛屽尮閰岖﹀彿宸﹀彸涓よ竟镄勪换镒忎竴涓琛ㄨ揪寮忋
锛氱敤𨱒ヨ浆涔夊厓瀛楃︽垨钥呰〃绀虹壒娈婂瓧绗︺
杩欎簺鍏冨瓧绗﹀湪姝e垯琛ㄨ揪寮忎腑缁忓父浣跨敤锛屽彲浠ョ粍钖堟垚钖勭嶅嶆潅镄勬e垯琛ㄨ揪寮忥纴鐢ㄤ簬瀛楃︿覆镄勫尮閰嶅拰镟挎崲绛夋搷浣溿
⑵ python 正则表达式,怎样匹配以某个字符串开头,以某个字符串结尾的情况
python正则匹配以xx开头以xx结尾的单词的步骤:
1、假设需要匹配的字符串为:site sea sue sweet see case sse ssee loses需要匹配的为以s开头以e结尾的单词。正确的正则式为:sS*?e
2、使用python中re.findall函数表示匹配字符串中所有的可能选项,re是python里的正则表达式模块。findall是其中一个方法,用来按照提供的正则表达式,去匹配文本中的所有符合条件的字符串。
3、代码和结果如下:
text ='site sea sue sweet see case sse ssee loses'
re.findall(r'sS*?e',text)
结果为:['site', 'sue', 'see', 'sse', 'ssee']
(2)python正则匹配任意字符扩展阅读:
python正则匹配,以某某开头某某结尾的最长子串匹配
代码如下:
regVersions = re.search(r'(V|v)[0-9].*[0-9]', filename)
if regVersions:
print regVersions.group()
⑶ python 正则表达式.* 是什么意思
这看个,就可以看出\.应当是在代表一个.号,因为.在正则里有特定的含义,所以使用时要加转义,就是一个.的意思
⑷ python中正则匹配
你好:
给你一些正则表达式的语法:
##总结
##^匹配字符串的开始。
##$匹配字符串的结尾。
##匹配一个单词的边界。
##d匹配任意数字。
##D匹配任意非数字字符。
##x?匹配一个可选的x字符(换言之,它匹配1次或者0次x字符)。
##x*匹配0次或者多次x字符。
##x+匹配1次或者多次x字符。
##x{n,m}匹配x字符,至少n次,至多m次。
##(a|b|c)要么匹配a,要么匹配b,要么匹配c。
##(x)一般情况下表示一个记忆组(rememberedgroup)。你可以利用re.search函数返回对
##象的groups()函数获取它的值。
##正则表达式中的点号通常意味着“匹配任意单字符”
⑸ Python其实很简单 第十一章 正则表达式
正则表达式是一个特殊的字符序列,它用来检查一个字符串是否与某种模式匹配。正则表达式在编译程序中至关重要,但并不是每个人都需要特别深入的学习和掌握。在此,只介绍一些最基本的应用。
1、元字符
元字符是构成正则表达式的一些特殊字符。在正则表达式中,元字符被赋予了新的含义。
下面介绍一些常用的元字符及其含义:
. 匹配除换行符以外的任意字符。
w 匹配字母、数字、下划线或汉字。
W 匹配w所匹配的字符以外的字符。
s 匹配单个空白符(包括Tab键和换行符)。
S 匹配除s匹配的字符以外的字符。
d 匹配数字。
b 匹配单词的分界符,如:空格、标点符号或换行符。
^ 匹配字符串的开始
$ 匹配字符串的结束
2、限定符
限定符是在正则表达式中用来指定数量的字符。常用的限定符有:
? 匹配前面的字符0或1次。如:zo?m可以匹配zom和zm,但不能匹配 zoom
+ 匹配前面的字符1或n次。如:zo?m可以匹配zom和zoom,但不能匹配zm
* 匹配前面的字符0或n次。如:zo?m可以匹配zom、zoom和zm
{n} 匹配前面的字符n次。如:zo{2}m可以匹配zoom,但不能匹配zom和zm
{n,} 匹配前面的字符至少n次。如:zo{1,}m可以匹配zom和zoom,但不能匹配zm
{n,m} 匹配前面的字符至少n次,最多m次。如:zo{1,2}m可以匹配zom和zoom,但不能匹配zm
3、方括号”[ ]”的用途
方括号“[ ]”里可以列出某个字符范围。如:[aeiou]表示匹配任意一个元音字母,[zqsl]表示匹配姓氏“赵钱孙李”的拼音第一个字母。
4、排除字符
方括号”[ ]”中的“^”字符表示排除的意思,如:[^aeiou]表示匹配任意一个非元音字母的字符。
5、选择字符
字符“|”相当于“或”。如:(^d{3}[-]d{8})|(^d{4}[-]d{7})$可以匹配形如” - ”或“ - ”的电话号码格式。
6、转义字符
对于已经用于定义元字符和限定符的字符,需要加转义符“”来表示。
如:为了匹配形如“192.168.0.1”的IPv4地址(1~255.0~255.0~255.0~255),可以用这样的正则表达式:^(25[0-5]|2[0-4][0-9]|[0,1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]).(25[0-5]|2[0-4][0-9]|[0,1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0).(25[0-5]|2[0-4][0-9]|[0,1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0).(25[0-5]|2[0-4][0-9]|[0,1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[0-9])$
这里解释一下第一段IP地址的规则,取值范围为1~255,可分解为以下情况:
250~255:25[0-5];
200~249:2[0-4][0-9];
100~199:[01]{1}[0-9]{2};
0~99: [0-9]{1}[1-9]
再加上”.”: .
其他三段地址和第一段相似。
7、“( )”可以用于分组
在正则表达式中,用“( )”括起来的部分是一个整体。
8、r(或R)的意义
在正则表达式中,为了保证模式字符串为原生字符串(没有经过加工处理的字符串),可以在模式字符串前加上一个字符‘r’或‘R’。例如:
# 这里用到对的re.match()方法接下来介绍
>>> import re # 导入re模块
>>> re.match('bPy[a-z]+','Python') # 表达式'bPy[a-z]+'不能匹配’Python’
>>> re.match('bPy[a-z]+','Python') # 表达式'bPy[a-z]+'可以匹配’Python’
在上述代码中,原本要用作匹配单词开始或结束的元字符’b’在表达式中字符串中会被视为转义一个字符‘b’,为了转义’b’就不得不再加一个’’符号。
也可以采用下面的方法:
>>> re.match(r'bPy[a-z]+','Python') #加字符’r’,可以保证原生字符串
9、match()方法
Match()方法 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match() 就返回 none。
语法格式:
re.match(pattern, string, [flags])
其中,pattern表示匹配的正则表达式;string是要匹配的字符串;flags表示标志位,用于控制正则表达式的匹配方式,如:re.I表示不区分大小写。
例:
import re #导入re模块
print(re.match('www', 'www.python.org/').span()) #span()函数可以获取匹配的位置
print(re.match('org', 'www.python.org'))
输出结果为:
(0, 3) #在位置0到3(不包括3)匹配成功
None #从起始位置未能匹配成功
10、search()方法
search()方法用于在整个字符串中搜索第一个匹配的值,如果匹配成功,则返回Match对象,否则返回None。
语法格式:
re.search(pattern, string, [flags])
其中,pattern表示匹配的正则表达式;string是要匹配的字符串;flags表示标志位,用于控制正则表达式的匹配方式,如:re.I表示不区分大小写。
例如:
>>> re.search(r'Pyw+','It's easy to use Python, but it's not easy to learn Python.')
可以看出,目标字符串“It's easy to use Python, but it's not easy to learn Python.”中一共有两个‘Python’,search()方法可以从字符串的起始位置开始查找到‘Python’,当找到第一个匹配值后就停止查找,返回位置信息。
match()和search()的比较
match()要求目标字符串的起始位置就能匹配,search()对目标字符串全段进行逐次匹配,只要首次匹配成功就停止匹配。
请看下例:
>>> import re
>>> print(re.match(r'Pyw+','It's easy to use Python, but it's not easy to learn Python.'))
输出结果:None
11、findall()方法
findall()方法用于在整个字符串中搜索所有匹配的值,如果匹配成功,则返回以匹配值为元素的列表,否则返回空列表。
语法格式:
re.findall(pattern, string[, flags])
其中,pattern表示匹配的正则表达式;string是要匹配的字符串;flags表示标志位,用于控制正则表达式的匹配方式,如:re.I表示不区分大小写。
例:
>>> import re
>>>print(re.findall(r'Pyw+','It's easy to use Python, but it's not easy to learn Python.'))
输出结果:['Python', 'Python']
可以看出,findall()的结果没有指出匹配的具体位置。
12、正则表达式的应用
字符串替换
这里要用到sub()方法。它的语法格式如下:
re.sub(pattern, repl, string [,count] [,flgs])
其中,pattern是模式字符串;repl是用于替换的字符串;string是原字符串;可选参数count为模式匹配后替换的最大次数,省缺表示替换所有的匹配;可选参数flags的意义与前面的方法的该参数一致。
例:
>>> import re
>>> str1='x=36.567 y=123.234'
>>> str2=re.sub('.d+','',str1) #用空格代替小数点及其后的数字
>>> print(str2)
输出结果:x=36 y=123
分隔字符串
这里要用到split()方法。它的返回值为一个列表,它的语法格式如下:
re.split(pattern, string [,maxsplit] [,flgs])
其中,pattern是模式字符串;string是原字符串;可选参数maxsplit为最大拆分次数,省缺表示拆分所有的匹配;可选参数flags的意义与前面的方法的该参数一致。
例:
>>> import re
>>> str='白日依山尽,黄河入海流。欲穷千里目,更上一层楼!'
>>> re.split(r',|。|!',str) #按照“,”、“。”、“!”分隔字符串。
['白日依山尽', '黄河入海流', '欲穷千里目', '更上一层楼', '']
注意,返回值列表中多出了一个空字符。
⑹ python正则表达式是什么
python正则表达式是使用单个字符串来描述、匹配某个句法规则的字符串,常被用来检索、替换那些符合某个模式(规则)的文本。最初的正则表达式出现于理论计算机科学的自动控制理论和形式化语言理论中。
1950 年,数学家斯蒂芬·科尔·克莱尼利用称之为“正则集合”的数学符号来描述此模型。肯·汤普逊将此符号系统引入编辑器 QED,随后是 UNIX 上的编辑器 ed,并最终引入 grep。自此以后,正则表达式被广泛地应用于各种 UNIX 或类 UNIX 系统的工具中。目前,许多程序设计语言都支持利用正则表达式进行字符串操作。
正则表达式常用的特殊字符:
:将下一个字符标记为一个特殊字符、一个原义字符(Identity Escape,有 "^" "$" "(" ")" "*" "+" "{" "|" 共计12个)、一个向后引用(backreferences)或一个八进制转义符。例如“n”匹配字符“n”,“ ”匹配一个换行符,“\”匹配“”,“(”则匹配“(”。
^:匹配输入字符串的开始位置。如果设置了正则表达式的多行属性,“^”也可以匹配“ ”或“ ”之 后的位置。
[a-z]:字符范围,匹配指定范围内的任意字符。例如“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。
s:匹配任何空白字符,包括空格、制表符、换页符等,等效于“[f v]”。注意 Unicode 正则表达式 会匹配全角空格符。