當前位置:首頁 » 編程語言 » python常用

python常用

發布時間: 2023-06-11 15:14:22

python常用的正則表達式處理函數詳解

正則表達式是一個特殊的字元序列,用於簡潔表達一組字元串特徵,檢查一個字元串是否與某種模式匹配,使用起來十分方便。

在Python中,我們通過調用re庫來使用re模塊:

import re

下面介紹Python常用的正則表達式處理函數。

re.match函數

re.match 函數從字元串的起始位置匹配正則表達式,返回match對象,如果不是起始位置匹配成功的話,match()就返回None。

re.match(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字元串。

flags:標志位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。具體參數為:

re.I:忽略大小寫。

re.L:表示特殊字元集 w, W, , B, s, S 依賴於當前環境。

re.M:多行模式。

re.S:即 . ,並且包括換行符在內的任意字元(. 不包括換行符)。

re.U:表示特殊字元集 w, W, , B, d, D, s, S 依賴於 Unicode 字元屬性資料庫

re.X:為了增加可讀性,忽略空格和 # 後面的注釋。

import re #從起始位置匹配 r1=re.match('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.match('def','abcdefghi') print(r2)

運行結果:

其中,span表示匹配成功的整個子串的索引。

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num):匹配的整個表達式的字元串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。

groups():返回一個包含所有小組字元串的元組,從 1 到 所含的小組號。

import re s='This is a demo' r1=re.match(r'(.*) is (.*)',s) r2=re.match(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

運行結果:

上述代碼中的(.*)和(.*?)表示正則表達式的貪婪匹配與非貪婪匹配。

re.search函數

re.search函數掃描整個字元串並返回第一個成功的匹配,如果匹配成功則返回match對象,否則返回None。

re.search(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字元串。

flags:標志位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。

import re #從起始位置匹配 r1=re.search('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.search('def','abcdefghi') print(r2)

運行結果:

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num=0):匹配的整個表達式的字元串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。

groups():返回一個包含所有小組字元串的元組,從 1 到 所含的小組號。

import re s='This is a demo' r1=re.search(r'(.*) is (.*)',s) r2=re.search(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

運行結果:


從上面不難發現re.match與re.search的區別:re.match只匹配字元串的起始位置,只要起始位置不符合正則表達式就匹配失敗,而re.search是匹配整個字元串,直到找到一個匹配為止。

re.compile 函數

compile 函數用於編譯正則表達式,生成一個正則表達式對象,供 match() 和 search() 這兩個函數使用。

re.compile(pattern[, flags])

pattern:一個字元串形式的正則表達式。

flags:可選,表示匹配模式,比如忽略大小寫,多行模式等。

import re #匹配數字 r=re.compile(r'd+')  r1=r.match('This is a demo') r2=r.match('This is 111 and That is 222',0,27) r3=r.match('This is 111 and That is 222',8,27)   print(r1) print(r2) print(r3)

運行結果:

findall函數

搜索字元串,以列表形式返回正則表達式匹配的所有子串,如果沒有找到匹配的,則返回空列表。

需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。

findall(string[, pos[, endpos]])

string:待匹配的字元串。

pos:可選參數,指定字元串的起始位置,默認為0。

endpos:可選參數,指定字元串的結束位置,默認為字元串的長度。

import re #匹配數字 r=re.compile(r'd+')  r1=r.findall('This is a demo') r2=r.findall('This is 111 and That is 222',0,11) r3=r.findall('This is 111 and That is 222',0,27)   print(r1) print(r2) print(r3)

運行結果:

re.finditer函數

和 findall 類似,在字元串中找到正則表達式所匹配的所有子串,並把它們作為一個迭代器返回。

re.finditer(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字元串。

flags:標志位,用於控制正則表達式的匹配方式,如是否區分大小寫,多行匹配等。

import re  r=re.finditer(r'd+','This is 111 and That is 222') for i in r:   print (i.group())

運行結果:

re.split函數

將一個字元串按照正則表達式匹配的子串進行分割後,以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern:匹配的正則表達式。

string:待匹配的字元串。

maxsplit:分割次數,maxsplit=1分割一次,默認為0,不限次數。

flags:標志位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等。

import re  r1=re.split('W+','This is 111 and That is 222')  r2=re.split('W+','This is 111 and That is 222',maxsplit=1)  r3=re.split('d+','This is 111 and That is 222')  r4=re.split('d+','This is 111 and That is 222',maxsplit=1)  print(r1) print(r2) print(r3) print(r4)

運行結果:

re.sub函數

re.sub函數用於替換字元串中的匹配項。

re.sub(pattern, repl, string, count=0, flags=0)

pattern:正則中的模式字元串。

repl:替換的字元串,也可為一個函數。

string:要被查找替換的原始字元串。

count:模式匹配後替換的最大次數,默認0表示替換所有的匹配。

import re  r='This is 111 and That is 222' # 刪除字元串中的數字 r1=re.sub(r'd+','',r) print(r1) # 刪除非數字的字元串  r2=re.sub(r'D','',r) print(r2)

運行結果:

到此這篇關於Python常用的正則表達式處理函數詳解的文章就介紹到這了,希望大家以後多多支持!

⑵ Python編程5種常用工具是什麼

【導語】Python是一種開源的編程語言,可用於Web編程、數據科學、人工智慧以及許多科學應用,學習Python可以讓程序員專注於解決問題,而不是語法,由於Python擁有各式各樣的工具,因此更具優勢,在進行Python編程學習的時候,了解使用工具和編程基礎是主要的,那麼Python編程5種常用工具是什麼?一起來了解一下吧。

1、IDLE

在安裝Python時,默認也會安裝IDLE。這是最優秀的Python工具之一。它可以降低Python入門的門檻。它的主要功能包括Python
Shell窗口(互動式解釋器)、自動補齊、高亮顯示語法以及基本的集成調試器。IDLE輕巧易用,方便學習。但是,它不適用於大型項目。許多程序員都將其作為最佳的Python工具。

2、Scikit-learn

Scikit-learn是數據科學最常使用的Python工具之一。這是一款為機器學習和數據科學而設計的Python工具。該工具主要用於處理分類、回歸、聚類、模型選擇以及預處理等任務。scikit-Learn最出色的功能是在測試數據集上執行基準測試時,表現出的驚人速度。因此,對於程序員和學生來說,Scikit-learn是最優秀的Python工具之一。

3、Theano

Theano是一款數據科學的Python工具,對於程序員和學生而言,這是一款非常可靠的工具。它是深度學習方面最好的Python工具,因此非常適合深度學習。Theano的設計主旨是用戶友好、模塊化、易於擴展,而且可以與Python配合使用。它能夠以最佳方式表達神經網路。Theano可以在TensorFlow和CNTK等流行的神經網路之上運行。

4、Selenium

Selenium是最佳的Python自動化工具之一。它適用於Python測試的自動化,常常用作Web應用程序的自動化框架。我們可以利用Selenium,通過許多編程語言(包括Java、C#、Python、ruby以及其他許多程序員和學生使用的語言)來編寫測試腳本。你還可以在Selenium中集成Junit和TestNG等工具,來管理測試用例並生成報告。

5、Test complete

Testcomplete是另一款非常出色的Python自動化工具。支持Web、移動和桌面自動化測試。更高級的應用需要獲得商業許可,而且它還可以幫助學生提高學業成績。Test
complete還可以像機器人框架一樣執行關鍵字驅動的測試。它擁有最出色的錄制以及回放功能,非常實用。

關於Python編程常用工具,就給大家介紹到這里了,以上的五種工具希望大家能夠好好利用,工具的使用必然能夠更好的簡化程序編寫,所以還是希望大家能夠不斷進行技能提升,加油!

⑶ python常用函數

1、complex()

返回一個形如a+bj的復數,傳入參數分為三種情況:

參數為空時,返回0j;參數為字元串時,將字元串表達式解釋為復數形式並返回;參數為兩個整數(a,b)時,返回a+bj;參數只有一個整數 a 時,虛部 b 默認為0,函數返回a+0j。

4、enumerate(iterable,start=0)

iterable -- 一個可迭代對象,列表、元組序列等;start -- 計數索引值,默認初始為0『該函數返回枚舉對象是個迭代器,利用 next() 方法依次返回元素值,每個元素以元組形式存在,包含一個計數元素(起始為 start )和 iterable 中對應的元素值。

⑷ Python有哪些常用的數據類型

Numbers(數字型):

即我們常說的1,2,3等等這些數字,Python有兩個常見的數據類型轉化函數:int和float,一般數據類型可以用來做一些算術功能,如加減乘除乘方等等,還可以用作比較功能,一般返回的是true和false,也就是大於、等於、小於、小於等於諸如此類的有很多,這里就不一一解釋了。

String(字元串):

字元串是Python中比較常見的數據類型之一,能夠使用str函數將其他類型的數據強制轉換為字元串類型,有三種生成方法,即單引號'XXX',雙引號"XXX",三引號'''XXX
''',其中三引號一般用於字元串內容較長的時候。

List(列表):

列表可以說是Python中最為活躍的一個數據類型,使用也很頻繁,操作也很多,可以通過list函數或方括弧[]進行列表的創建。常見函數如求長度,用len,合並多個列表用+,列表元素重復*等等。

Tuple(元組):

元組可以看成是一種不可修改的特殊列表,可以通過小括弧()或者tuple函數來創建,即便是只有一個元素,元組中的元素最後也要有逗號。常見操作有求長度len,元組元素重復*,元組拼接+,查看最值max、min等。

Dictionary(字典):字元串、列表、元組都是有序的數據類型,字典是無序的數據類型,主要是用來存放具有一定映射關系的數據。可以通過兩種方法創建,1、{}2、dict函數創建。

set(集合):

集合不能有重復元素,可以看作是列表和字典的「雜合體」,可以通過三種方式創建,1、set函數,空集合只能用這種方法;2、{}創建,3、創建凍集合,frozenst。

⑸ 常用的python庫有哪些

10個頂級且實用的python庫

1、Dash

Dash是比較新的軟體包,它是用純python構建數據可視化app的理想選擇,因此特別適合處理數據的任何人。Dash是Flask、Plotly.js和React.js的混合體。

2、Pygame

Pygame是SDL多媒體庫的python裝飾器,SDL是一個跨平台開發庫,旨在提供對以下內容的低級介面:音頻、鍵盤、滑鼠、游戲桿、基於OpenGL和Direct3D的圖形硬體。

Pygame具有高度的可移植性,幾乎可以在所有平台和操作系統上運行。盡管它具有完善的游戲引擎,但您也可以使用此庫直接從python腳本播放MP3文件。

3、Pillow

Pillow專門用於處理圖像,您可以使用該庫創建縮略圖,在文件格式之間轉換、旋轉、應用濾鏡、顯示圖像等等。如果您需要對許多圖像執行批量操作,這是理想的選擇。

4、Colorama

Colorama允許你在終端使用顏色,非常適合python腳本,文檔簡短而有趣,可以在Colorama PyPi頁面上找到。

5、JmesPath

在python中使用JSON非常容易,因為JSON在python字典上的映射非常好。此外,python帶有自己出色的json庫,用於解析和創建JSON。對我來說,這是它最好的功能之一,如果我需要使用JSON,可以考慮使用python。

JmesPath使python處理JSON更加容易,它允許您明確地指定如何從JSON文檔中提取元素。

6、Requests

Requests建立在世界上下載量最大的python庫urllib3上,它令Web請求變得非常簡單,功能強大且用途廣泛。

Requests可以完成您能想到的所有高級工作,比如:認證,使用cookie,執行POST、PUT、DELETE等,使用自定義證書,使用會話Session、使用代理等。

7、Simplejson

python中的本地json模塊有什麼問題?沒有!實際上,python的json是Simplejson。意思是:python採用了Simplejson的一個版本,並將其合並到每個發行版中,但是使用Simplejson具有一些優點:它適用於更多python版本、它比python隨附的版本更新頻率更高、它具有用C編寫的部分,因此非常快速。

8、Emoji

Emoji庫非常意思,但並非每個人都喜歡表情包,分析視角媒體數據時,Emoji包非常有用。

9、Python-dateutil

Python-dateutil模塊提供了對標准datetime模塊的強大擴展。我的經驗是:常規的python日期時間功能在哪裡結束,而Python-dateutil就出現了。

10、BeautifulSoup

如果您從網站上提取了一些HTML,則需要對其進行解析以獲取實際所需的內容。BeautifulSoup是一個python庫,用於從HTML和XML文件中提取數據。它提供了導航,搜索和修改解析樹的簡單方法。它非常強大,即使損壞了,也能夠處理各種HTML,這是一個非常強大的功能。

它的一些主要功能:

①BeautifulSoup會自動將傳入文檔轉換為Unicode,將傳出文檔轉換為UTF-8,您無需考慮編碼。

②BeautifulSoup位於流行的python解析器的頂部,使您可以嘗試不同的解析策略或提高靈活性。

⑹ Python常用的標准庫以及第三方庫有哪些

Python常用的標准庫有http庫。第三方庫有scrapy,pillow和wxPython.以下有介紹:

  1. Requests.Kenneth Reitz寫的最富盛名的http庫,每個Python程序員都應該有它。

  2. Scrapy.如果你從事爬蟲相關的工作,那麼這個庫也是必不可少的。用過它之後你就不會再想用別的同類庫了。

  3. wxPython.Python的一個GUI(圖形用戶界面)工具。我主要用它替代tkinter。

  4. Pillow.它是PIL的一個友好分支。對於用戶比PIL更加友好,對於任何在圖形領域工作的人是必備的庫。

⑺ python可以用來做什麼

1、Web應用開發

伺服器端編程,具有豐富的Web開發框架,如Django和TurboGears,快速完成一個網站的開發和Web服務。典型如國內的豆瓣、果殼網等;國外的Google、Dropbox等。

2、系統網路運維

在運維的工作中,有大量重復性工作的地方,並需要做管理系統、監控系統、發布系統等,將工作自動化起來,提高工作效率,這樣的場景Python是一門非常合適的語言。

3、科學與簡灶數字計算

Python被廣泛的運用於科學和數字計算中,例如生物信息學、物理、建築、地理信息系統、圖像可視化分析、生命科學等,常用numpy、SciPy、Biopython、SunPy等。

4、3D游戲開發

Python有很好的3D渲染庫和游戲開發框架,有很多使用Python開發的游戲,如迪斯尼卡通城、黑暗之刃。常用PyGame、Pykyra等和一個PyWeek的比賽。

5、圖形界面開發

Python可編寫桌面圖形用戶界面,還可以擴展微軟的Windows,常用Tk、GTK+、PyQt、win32等。

6、網路編程

除了網路和祥埋互聯網的支持,Python還提供了對底層網路的支持,有易於使用的Socket介面和一個非同步的網路編程框架TwistedPython。

7、人工智慧

Python語言對於人工智慧來說是最好的語言。隨著人工智慧的普及,Python使用也會越來越廣攔宴扮泛。想學Python開發,歡迎來中公優就業。

熱點內容
大眾空調登錄密碼多少 發布:2025-02-13 16:16:08 瀏覽:33
等差數列求和c語言 發布:2025-02-13 16:10:05 瀏覽:714
安卓手機如何無密碼解鎖vivo 發布:2025-02-13 15:52:10 瀏覽:885
電信50m上傳 發布:2025-02-13 15:47:56 瀏覽:364
清理outlook2010緩存 發布:2025-02-13 15:43:30 瀏覽:55
ohem演算法 發布:2025-02-13 15:40:10 瀏覽:931
java編程課程 發布:2025-02-13 15:36:08 瀏覽:476
cs編譯 發布:2025-02-13 15:36:07 瀏覽:56
高級語言都要編譯解析型語言 發布:2025-02-13 15:06:32 瀏覽:305
openwrt源碼下載 發布:2025-02-13 15:01:59 瀏覽:645