當前位置:首頁 » 編程語言 » python正則表達式提取字元

python正則表達式提取字元

發布時間: 2023-09-14 09:21:23

『壹』 在python中,利用正則表達式在html中,提取每三行中的特定字元,形成一個列表,每個列表中的元

import re

file_object = open('temp.txt')
try:
str = file_object.read( )
finally:
file_object.close( )
result = re.findall("(\d+%) S\s+\d+ (\d+)K\s+(\d+)K",str)
f = open("test.csv","w")
for line in result:
f.write("%s,%s,%s\n"%(line[0],line[1],line[2]))
f.close()

『貳』 python語言 正則表達式 取{}之間的字元,不包括大括弧


python
中,
str.replace
函數接受的第一個參數並不是正則表達式,而是字元串。
所以你會看到,運行
print '123(abc)123'.replace('(abc)', '!')的結果是
'123!123'
想要達到你所說的效果,可以試一試
python
中的
re
模塊
例如:
import re
replace_reg = re.compile(r'abc$')
print replace_reg.sub('x', '123abc') 的運行結果為:
'123x'

『叄』 python 正則表達式re.sub()提取字元串以及去除空格

Python 的re模燃搏塌塊提供了re.sub用於替換字元串中的匹配項。

語法:

re.sub(pattern, repl, string, count=0)

參數:

pattern : 正則中的模式字元串。

repl : 替換的字元串,也可為一個函數。

string : 要被查找替換的原始字元串。

count : 模式匹配後替換的最大次數,默認 0 表示替換所有的匹配皮圓。

實例:

註:re.sub(r'[a-zA-Z",:{}]', "", data),銀念中括弧表示選擇其中的任意元素,a-zA-Z表示任意字母。

『肆』 python 正則表達式中提取字元串

import re
pattern = re.compile(r'\@[^ ]+',re.I)
result = pattern.findall('abcde / @kkshj_j123shaa / HAN HAN / 來源')
print(result)

『伍』 python 字元串提取信息方法總結

在日常項目中,我們經常會使用python從字元串中提取我們想要的信息,以下是各種提取信息方法的總結。

格式: str[beg:end:step]
描述: 字元串[開始索引:結束索引:步長]切取字元串為開始索引到結束索引-1內的字元串步長不指定時步長為1

舉例:
print(str[::2]) //::這里表示整個字元串,每兩個位置提取一個
print(str[1:3]) //提取第2個到第3個
print(str[2::]) //截取2 - 末尾的字元

本小節介紹了,處理字元串經常用到的一些函數方法。

語法: str.find(str, beg=0, end=len(string))
描述: Python find() 方法檢測字元串中是否包含子字元串 str ,如果指定 beg(開始) 和 end(結束) 范圍,則檢查是否包含在指定范圍內,如果包含子字元串返回開始的索引值,否則返回-1。

語法: str.split(str="", num=string.count(str)).
描述: Python split() 通過指定分隔符對字元串進行切片,如果參數 num 有指定值,則分隔 num+1 個子字元串.返回分割後的字元串列表,該方法可以講字元串轉化為列表處理。

另外的: str.splitlines([keepends])按照行(' ', ' ', ')分隔,返回一個包含各行作為元素的列表,如果參數 keepends 為 False,不包含換行符,如果為 True,則保留換行符。

語法: str.partition(str)
描述: partition() 方法用來根據指定的分隔符將字元串進行分割。如果字元串包含指定的分隔符,則返回一個3元的元組,第一個為分隔符左邊的子串,第二個為分隔符本身,第三個為分隔符右邊的子串。

語法: str.replace(old, new, max)
描述: Python replace() 方法把字元串中的 old(舊字元串) 替換成 new(新字元串),如果指定第三個參數max,則替換不超過 max 次。

語法: str.strip([chars]);
描述: Python strip() 方法用於移除字元串頭尾指定的字元(默認為空格或換行符)或字元序列。:該方法只能刪除開頭或是結尾的字元,不能刪除中間部分的字元。

語法: str.join(sequence)
描述: Python join() 方法用於將序列中的元素以指定的字元連接生成一個新的字元串。

上述方法還有其變形,如str.rfind(),這代表從字元串右邊開始處理,正常是從左邊開始處理。下表是其它常用的python字元串自帶函數方法。

正則表達式是一個特殊的字元序列,它能幫助你方便的檢查一個字元串是否與某種模式匹配。本小節主要介紹Python中常用的正則表達式處理函數和正則表達式的書寫規則。
re 模塊使 Python 語言擁有全部的正則表達式功能。所以在python中使用正則表達式處理函數需要import re

語法: re.search(pattern, string, flags=0)
描述: re.search 掃描整個字元串並返回第一個成功的匹配。匹配成功re.search方法返回一個匹配的對象,否則返回None。

語法: re.sub(pattern, repl, string, count=0, flags=0)
描述: Python 的 re 模塊提供了re.sub用於替換字元串中的匹配項。

語法: pattern.findall(string, pos, endpos)
描述: 在字元串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。注意: match 和 search 是匹配一次 findall 匹配所有。

模式字元串使用特殊的語法來表示一個正則表達式:

『陸』 python正則表達式提取字元串中的數字 字元串如下

>>>importre
>>>str1='balance-rr0'
>>>mode=re.compile(r'd+')
>>>
>>>mode.findall(str1)
['0']
>>>str1='12j33jk12ksdjfkj23jk4h1k23h'
>>>mode.findall(str1)
['12','33','12','23','4','1','23']
>>>

熱點內容
滑板鞋腳本視頻 發布:2025-02-02 09:48:54 瀏覽:432
群暉怎麼玩安卓模擬器 發布:2025-02-02 09:45:23 瀏覽:557
三星安卓12彩蛋怎麼玩 發布:2025-02-02 09:44:39 瀏覽:743
電腦顯示連接伺服器錯誤 發布:2025-02-02 09:24:10 瀏覽:536
瑞芯微開發板編譯 發布:2025-02-02 09:22:54 瀏覽:146
linux虛擬機用gcc編譯時顯示錯誤 發布:2025-02-02 09:14:01 瀏覽:232
java駝峰 發布:2025-02-02 09:13:26 瀏覽:651
魔獸腳本怎麼用 發布:2025-02-02 09:10:28 瀏覽:532
linuxadobe 發布:2025-02-02 09:09:43 瀏覽:212
sql2000資料庫連接 發布:2025-02-02 09:09:43 瀏覽:726