python正則表達式函數
❶ 如何編寫python的正則表達式
Python re正則匹配中文,其實非常簡單,把中文的unicode字元串轉換成utf-8格式就可以了,然後可以在re中隨意調用
unicode中中文的編碼為/u4e00-/u9fa5,因此正則表達式u」[\u4e00-\u9fa5]+」可以表示一個或者多個中文字元
>>> import re
>>> s='中文:123456aa哈哈哈bbcc'.decode('utf8')
>>> s
u'\u4e2d\u6587\uff1a123456aa\u54c8\u54c8\u54c8bbcc'
>>> print s
中文:123456aa哈哈哈bbcc
>>> re.match(u"[\u4e00-\u9fa5]+",s)
<_sre.SRE_Match object at 0xb77742c0>
>>> pat='中文'.decode("utf8")
>>> re.search(pat,s)
<_sre.SRE_Match object at 0x16a16df0>
>>> newpat='這里是中文內容'.decode("utf8")
>>> news=re.sub(pat,newpat,s)
>>> print news
這里是中文內容:123456aa哈哈哈bbcc
❷ python正則表達式匹配
import re
print(re.findall(r"[12|22]+3", "123223"))
❸ python 判斷正則表達式
看了你的提問,你的要求是:
輸入格式:
輸入包含兩行:
待匹配字元串
正則表達式
輸出格式:
若正則表達式能夠匹配第一行字元串則輸出True,否則,輸出False
以下是我依據你的功能需求,個人簡單寫的一些代碼,供你參考:
importre
flg=True
#定義主要工作代碼函數
defjobCode(txtstr,regex):
result=re.search(regex,txtstr)
#如果匹配第一行字元串flg為True,否則flg為False
ifresult.group()==txtstr:
#print(result.group())
returnflg==True#返回flg並終止循環
else:
#print(result.group())
returnflg==False#返回flg並終止循環
#程序主入口
if__name__=='__main__':
txtstr=str(input("請輸入待匹配的字元串:"))
regex=input("請輸入正則表達式:")
print(jobCode(txtstr,regex))#調用定義函數jobCode()
代碼應該還能更簡潔,具體你自己去完善。
純手工,如果對你有幫助望採納!
❹ python正則表達式函數match和search的區別詳解
python re文檔上有對match VS search的話,摘錄如下
Python offers two different primitive operations based on regular expressions:
re.match() checks for a match only at the beginning
of the string, while re.search() checks for a match anywhere in the
string (this is what Perl does by default).
翻譯:
python提供了2個基於正則表達式的不同的原始操作。re.match驗證只有開頭才匹配的字元串對象。而re.search()可以驗證在任何位置的字元串(這一項也是perl語言所默認的)
所以區別就是,一個只匹配開頭的字元串,一個可以匹配任意地方
舉例說明:
re.match("c", "abcdef") # 不匹配,match的返回值是None
re.search("c", "abcdef") # Match
mat = re.match("c", "cdef") # match
print mat.group()#可以列印出匹配的c
❺ 如何用python正則
(1)re.match()函數
re.match 嘗試從字元串的開始匹配一個模式。
函數語法:
re.match(pattern, string, flags=0)
函數參數說明:
參數
描述
pattern 匹配的正則表達式
string 要匹配的字元串。
flags 標志位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。
匹配成功re.match方法返回一個匹配的對象,否則返回None。
我們可以使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。
匹配對象方法
描述
group(num=0) 匹配的整個表達式的字元串,group() 可以一次輸入多個組號,在這種情況下它將返回一個包含那些組所對應值的元組。
groups() 返回一個包含所有小組字元串的元組,從 1 到 所含的小組號。
(2)re.research()函數
re.search匹配整個字元串,直到找到一個匹配。
函數語法:
re.search(pattern, string, flags=0)
函數參數說明:
參數
描述
pattern 匹配的正則表達式
string 要匹配的字元串。
flags 標志位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。
匹配成功re.search方法方法返回一個匹配的對象,否則返回None。
我們可以使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。
匹配對象方法
描述
group(num=0) 匹配的整個表達式的字元串,group() 可以一次輸入多個組號,在這種情況下它將返回一個包含那些組所對應值的元組。
groups() 返回一個包含所有小組字元串的元組,從 1 到 所含的小組號。
(3)實例
我這里採用re.search()函數解決的問題。
測試數據集為購物網站用戶評論
實例代碼:
[python]view plain
#-*-coding:utf-8-*-
importsys
importre
reload(sys)
text=open('JD_DFB_comments.txt')
line=text.readline()
#i=0
whileline:
#i=i+1
#re.search匹配整個字元串,直到找到一個匹配。
n1=re.search(r'(要(是|能)(.*)就(更|好|再|直觀|完美|太)(.*)了)',line)
n2=re.search(r'(如果)(.*)就(更|好|再|直觀|完美|太)(.*)了',line)
#打開將要寫入的數據
data=open('aa.txt','a')
ifn1:
#printline
data.write(line)#寫入匹配到的數據
#printi記錄匹配結果所在的行數
#printn1.group()#等於printline
printn1.group(3)#打出第三個括弧里的內容
ifn2:
#printn2.group()
printn2.group(2)
line=text.readline()
text.close()
閱讀更多
個人分類:Python語言
想對作者說點什麼?我來說一句
Python中re的match、search、findall、finditer區別
❻ python 正則表達式,怎樣匹配以某個字元串開頭,以某個字元串結尾的情況
python正則匹配以xx開頭以xx結尾的單詞的步驟:
1、假設需要匹配的字元串為:site sea sue sweet see case sse ssee loses需要匹配的為以s開頭以e結尾的單詞。正確的正則式為:sS*?e
2、使用python中re.findall函數表示匹配字元串中所有的可能選項,re是python里的正則表達式模塊。findall是其中一個方法,用來按照提供的正則表達式,去匹配文本中的所有符合條件的字元串。
3、代碼和結果如下:
text ='site sea sue sweet see case sse ssee loses'
re.findall(r'sS*?e',text)
結果為:['site', 'sue', 'see', 'sse', 'ssee']
(6)python正則表達式函數擴展閱讀:
python正則匹配,以某某開頭某某結尾的最長子串匹配
代碼如下:
regVersions = re.search(r'(V|v)[0-9].*[0-9]', filename)
if regVersions:
print regVersions.group()
❼ python里正則表達式()問題求助
不相等,正則上好像沒有as的兩倍這種東西
(as){2}意思是匹配出現兩次的as
如果你 需要處理的字元串 是"234as"會匹配不到
也就是連續出現2次asas才會返回一個
❽ python正則表達式
re.findall(r'\\x[0-9A-Za-z]{2}',r"ABC\x1a\xb3\x5d123def\x00")
re.findall(r'ABC(.+?)\\x00',r"ABC\x1a\xb3\x5d123def\x00")
都可以
❾ python|正則表達式
\1指的就是捕獲組1的內容,具體內容你可以搜索下(也叫後向引用),/i是忽略大小寫,g是搜索所有內容,\b是指單詞的開頭或結尾
整個連起來/\b([a-z]+) \1\b/ig就表示在字元串中搜索重復的單詞(以字母開頭),忽略大小小,所以匹配會得到3組內容,即Is is、of of和up up
❿ python正則表達式是什麼
正則表達式(regex)用於探索給定字元串中的固定模式。我們想找到的模式可以是任何東西。可以創建類似於查找電子郵件或手機號碼的模式。還可以創建查找以a開頭、以z結尾的字元串的模式。
創建模式:
使用正則表達式時,首先需要學習的是如何創建模式。接下來將對一些最常用的模式進行逐一介紹。可以想到最簡單的模式是一個簡單的字元串。
pattern = r'times'
string = "It was the best of times, it was the worst of times."
print(len(re.findall(pattern,string)))
注意:
「正則表達式,又稱規則表達式(英語:Regular Expression,在代碼中常簡寫為regex、regexp或re),是計算機科學的一個概念。正則表達式通常被用來檢索、替換那些符合某個模式(規則)的文本」,那使用正則表達式的目的是什麼呢?網路中只寫了兩句話:
1. 給定的字元串是否符合正則表達式的過濾邏輯(稱作「匹配」)。
2. 可以通過正則表達式,從字元串中獲取我們想要的特定部分。
大家可以簡單的理解為兩點:search和match。OK,了解了正則表達式的概念和作用,我們趕緊進入Python的學習吧!正則表達式不是Python獨有的武器,但Python中的正則表達式無疑是最簡單卻又最強大的。