python的字符串处理函数

发布时间: 2023-04-06 13:20:55

1. format在python中的用法

fotmat作为Python的的格式字符串函数，主要通过字符串中的花括号{}，来识别替换字段，从而完成字符串的格式化。format是python2.6新增的一个格式化字符串的方法，相对于老版的%格式方法，它有很多优点。单个参数可以多次输出，参数顺序可以不相同。

python中的format函数用法

基本语法是通过{}和：来代替以前的%

1、例如输出保留两位的数字：print("{:.2f}".format(3.1456879))，且会四舍五入。

2、大括号里可以填索引，以此来保证后续format中参数的顺序位置，例如：

print("{2}{0}{1}".format("are"，"you"，"How"))

输出为Howareyou，注意索引应从0开始。

而且需要注意的是如果未填索引，那么会默认按format中参数顺序位置填充，此时大括号占位数要与format参数相等。如果填充索引，索引数需要不大于format索引数。

3、如果是双层大括号结构，则认为第二层大括号为普通字符串，不会进行格式化。例如：

print("{}对应的位置是{{普通字符串}}".format("字符串"))

输出为：字符串对应的位置是{普通字符串}，注意加粗部分，第二层大括号会作为普通的字符串，不会进行格式化。

2. python 8个常用内置函数解说

8个超好用内置函数set（），eval（），sorted（），reversed（），map（），rece（），filter（），enumerate（）

python中有许多内置函数，不像print那么广为人知，但它们却异常的强大，用坦枣好了可以大大提高代码效率。

这次来梳理下8个好用的python内置函数

1、set()

当需要对一个列表进行去重操作的时候，set()函数就派上用场了。

用于创建一个集合，集合里的元素是无序且不重复的。集合对象创建后，还能使用并集、交集、差集功能。

2、eval()之前有人问如何用python写一个四则运算器，输入字符串公式，直接产生结果。用eval()来做就很简单：eval(str_expression)作用是将字符串转换成表达式，并且执行。

3、sorted()在处理数据过程中，我们经常会用到排序操作，比如将列表、字典、元组里面的元素正/倒排序。这时候就需要用到sorted() ，它可以对任何可迭代对象进行排序，并返回列表。对列表升序操作：

对元组倒序操作：

使用参数：key，根据自定义规则，按字符串长度来排序：

根据自定义规则，对元组构成的列表进行排序：

4、reversed()如果需要对序列的元素进行反转操作，reversed()函数能帮到你。reversed()接受一个序列，将序列里的元素反转，并最终返回迭代器。

5、map()做文本处理的时候，假如要对序列里的每个单词进行大写转化操作。这个时候就可以使用map()函数。

map()会根据提供的函数，对指定的序列做映射，最终返回迭代器。也就是说map()函数会把序列里的每一个元素用指定的方法加工一遍，最终返回给你加工好的序列。举个例子，对列表里的每个数字作平方处理：

6、rece()前面说空备到对列表里的每个数字作平方处理，用map()函数。那我想将列表里的每个元素相乘，该怎么做呢？这时候用到rece()函数。

rece()会对参数序列中元素进行累积。第一、第二个元素先进行函数操作，生成的结果再和第三个元素进行函数操作，以此类推，最终生成所有元素累积运让亏拆算的结果。再举个例子，将字母连接成字符串。

你可能已经注意到，rece()函数在python3里已经不再是内置函数，而是迁移到了functools模块中。这里把rece()函数拎出来讲，是因为它太重要了。

7、filter()一些数字组成的列表，要把其中偶数去掉，该怎么做呢？

filter()函数轻松完成了任务，它用于过滤序列，过滤掉不符合条件的元素，返回一个迭代器对象。filter()函数和map()、rece()函数类似，都是将序列里的每个元素映射到函数，最终返回结果。我们再试试，如何从许多单词里挑出包含字母w的单词。

8、enumerate()这样一个场景，同时打印出序列里每一个元素和它对应的顺序号，我们用enumerate()函数做做看。

enumerate翻译过来是枚举、列举的意思，所以说enumerate()函数用于对序列里的元素进行顺序标注，返回(元素、索引)组成的迭代器。再举个例子说明，对字符串进行标注，返回每个字母和其索引。

3. python字符串常用方法

python字符串常用方法
1. Python字符串拼接（包含字符串拼接数字）
2. Python截取字符串（字符串切片）
3. Python 的len()函数：获取字符串长度或字节数
4. Python split()方法：分割字符串
5. Python join()方法：合并字符串
6. Python count()方法：统计字符串出现的次数
7. Python find()方法：检测字符串中是否包含某子串
8. Python index()方法：检测字符串中是否包含某子串
9. Python字符串对齐方法（ljust()、rjust()和center()）
10. Python startswith()和endswith()方法
11. Python字符串大小写转换（3种）函数
12. Python去除字符串中空格（删除指定字符）的3种方法

4. python 字符串提取信息方法总结

在日常项目中，我们经常会使用python从字符串中提取我们想要的信息，以下是各种提取信息方法的总结。

格式： str[beg:end:step]
描述： 字符串[开始索引：结束索引：步长]切取字符串为开始索引到结束索引-1内的字符串步长不指定时步长为1

举例：
print(str[::2]) //：：这里表示整个字符串，每两个位置提取一个
print(str[1:3]) //提取第2个到第3个
print(str[2::]) //截取2 - 末尾的字符

本小节介绍了，处理字符串经常用到的一些函数方法。

语法： str.find(str, beg=0, end=len(string))
描述： Python find() 方法检测字符串中是否包含子字符串 str ，如果指定 beg（开始）和 end（结束）范围，则检查是否包含在指定范围内，如果包含子字符串返回开始的索引值，否则返回-1。

语法： str.split(str="", num=string.count(str)).
描述： Python split() 通过指定分隔符对字符串进行切片，如果参数 num 有指定值，则分隔 num+1 个子字符串.返回分割后的字符串行表,该方法可以讲字符串转化为列表处理。

另外的： str.splitlines([keepends])按照行(' ', ' ', ')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。

语法： str.partition(str)
描述： partition() 方法用来根据指定的分隔符将字符串进行分割。如果字符串包含指定的分隔符，则返回一个3元的元组，第一个为分隔符左边的子串，第二个为分隔符本身，第三个为分隔符右边的子串。

语法： str.replace(old, new, max)
描述： Python replace() 方法把字符串中的 old（旧字符串）替换成 new(新字符串)，如果指定第三个参数max，则替换不超过 max 次。

语法： str.strip([chars]);
描述： Python strip() 方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。

语法： str.join(sequence)
描述： Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

上述方法还有其变形，如str.rfind(),这代表从字符串右边开始处理，正常是从左边开始处理。下表是其它常用的python字符串自带函数方法。

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。本小节主要介绍Python中常用的正则表达式处理函数和正则表达式的书写规则。
re 模块使 Python 语言拥有全部的正则表达式功能。所以在python中使用正则表达式处理函数需要import re

语法： re.search(pattern, string, flags=0)
描述： re.search 扫描整个字符串并返回第一个成功的匹配。匹配成功re.search方法返回一个匹配的对象，否则返回None。

语法： re.sub(pattern, repl, string, count=0, flags=0)
描述： Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。

语法： pattern.findall(string, pos, endpos)
描述： 在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。注意： match 和 search 是匹配一次 findall 匹配所有。

模式字符串使用特殊的语法来表示一个正则表达式：

5. 在Python中使用字符串调用函数

已有字符串形式的函数名称，那么如何调用这个函数呢？

通过调用内置函数locals()和globals()返回的字典对象，就可以可以获得名称与对象的映射关系。其中，locals()仅在全局范围内调用时可以获得函数对象。我们来看以下的例子。

需要注意的是，使用上述方法通过字符串调用函数时，为了系统的安全，防止执行任意函数，需要对函数名做一些处理，也就是使用统一的前缀为这些函数命名。例如在上述例子中，使用前缀cmd_+函数名的形式定义函数（cmd_help，cmd_sum）。
在传入函数名字符串时，只传入函数名的后半部分（如"help","sum"），由程序添加前缀后组成完整的函数名，再调用该函数。

对于类的成员函数，则可以使用getattr()获得类成员函数。

上述代码通过字符串调用了类成员函数，与前一段代码执行的结果相同。

此外，还可以使用字典将字符串与函数对应起来调用，缺点就是每增加一个函数需要相应在字典对象中添加相应的键值，增加代码维护工作量。

以上代码在Python 3.6以上运行通过。

6. Python常用的正则表达式处理函数详解

正则表达式是一个特殊的字符序列，用于简洁表达一组字符串特征，检查一个字符串是否与某种模式匹配，使用起来十分方便。

在Python中，我们通过调用re库来使用re模块：

import re

下面介绍Python常用的正则表达式处理函数。

re.match函数

re.match 函数从字符串的起始位置匹配正则表达式，返回match对象，如果不是起始位置匹配成功的话，match()就返回None。

re.match(pattern, string, flags=0)

pattern：匹配的正则表达式。

string：待匹配的字符串。

flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。具体参数为：

re.I：忽略大小写。

re.L：表示特殊字符集 w, W, , B, s, S 依赖于当前环境。

re.M：多行模式。

re.S：即 . ，并且包括换行符在内的任意字符（. 不包括换行符）。

re.U：表示特殊字符集 w, W, , B, d, D, s, S 依赖于 Unicode 字符属性数据库。

re.X：为了增加可读性，忽略空格和 # 后面的注释。

import re #从起始位置匹配 r1=re.match('abc','abcdefghi') print(r1) #不从起始位置匹配 r2=re.match('def','abcdefghi') print(r2)

运行结果：

其中，span表示匹配成功的整个子串的索引。

使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

group(num)：匹配的整个表达式的字符串，group() 可以一次输入多个组号，这时它将返回一个包含那些组所对应值的元组。

groups()：返回一个包含所有小组字符串的元组，从 1 到所含的小组号。

import re s='This is a demo' r1=re.match(r'(.*) is (.*)',s) r2=re.match(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

运行结果：

上述代码中的(.*)和(.*?)表示正则表达式的贪婪匹配与非贪婪匹配。

re.search函数

re.search函数扫描整个字符串并返回第一个成功的匹配，如果匹配成功则返回match对象，否则返回None。

re.search(pattern, string, flags=0)

pattern：匹配的正则表达式。

string：待匹配的字符串。

flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

import re #从起始位置匹配 r1=re.search('abc','abcdefghi') print(r1) #不从起始位置匹配 r2=re.search('def','abcdefghi') print(r2)

运行结果：

使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

group(num=0)：匹配的整个表达式的字符串，group() 可以一次输入多个组号，这时它将返回一个包含那些组所对应值的元组。

groups()：返回一个包含所有小组字符串的元组，从 1 到所含的小组号。

import re s='This is a demo' r1=re.search(r'(.*) is (.*)',s) r2=re.search(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

运行结果：

从上面不难发现re.match与re.search的区别：re.match只匹配字符串的起始位置，只要起始位置不符合正则表达式就匹配失败，而re.search是匹配整个字符串，直到找到一个匹配为止。

re.compile 函数

compile 函数用于编译正则表达式，生成一个正则表达式对象，供 match() 和 search() 这两个函数使用。

re.compile(pattern[, flags])

pattern：一个字符串形式的正则表达式。

flags：可选，表示匹配模式，比如忽略大小写，多行模式等。

import re #匹配数字 r=re.compile(r'd+') r1=r.match('This is a demo') r2=r.match('This is 111 and That is 222',0,27) r3=r.match('This is 111 and That is 222',8,27) print(r1) print(r2) print(r3)

运行结果：

findall函数

搜索字符串，以列表形式返回正则表达式匹配的所有子串，如果没有找到匹配的，则返回空列表。

需要注意的是，match 和 search 是匹配一次，而findall 匹配所有。

findall(string[, pos[, endpos]])

string：待匹配的字符串。

pos：可选参数，指定字符串的起始位置，默认为0。

endpos：可选参数，指定字符串的结束位置，默认为字符串的长度。

import re #匹配数字 r=re.compile(r'd+') r1=r.findall('This is a demo') r2=r.findall('This is 111 and That is 222',0,11) r3=r.findall('This is 111 and That is 222',0,27) print(r1) print(r2) print(r3)

运行结果：

re.finditer函数

和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

re.finditer(pattern, string, flags=0)

pattern：匹配的正则表达式。

string：待匹配的字符串。

flags：标志位，用于控制正则表达式的匹配方式，如是否区分大小写，多行匹配等。

import re r=re.finditer(r'd+','This is 111 and That is 222') for i in r: print (i.group())

运行结果：

re.split函数

将一个字符串按照正则表达式匹配的子串进行分割后，以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern：匹配的正则表达式。

string：待匹配的字符串。

maxsplit：分割次数，maxsplit=1分割一次，默认为0，不限次数。

flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等。

import re r1=re.split('W+','This is 111 and That is 222') r2=re.split('W+','This is 111 and That is 222',maxsplit=1) r3=re.split('d+','This is 111 and That is 222') r4=re.split('d+','This is 111 and That is 222',maxsplit=1) print(r1) print(r2) print(r3) print(r4)

运行结果：

re.sub函数

re.sub函数用于替换字符串中的匹配项。

re.sub(pattern, repl, string, count=0, flags=0)

pattern：正则中的模式字符串。

repl：替换的字符串，也可为一个函数。

string：要被查找替换的原始字符串。

count：模式匹配后替换的最大次数，默认0表示替换所有的匹配。

import re r='This is 111 and That is 222' # 删除字符串中的数字 r1=re.sub(r'd+','',r) print(r1) # 删除非数字的字符串 r2=re.sub(r'D','',r) print(r2)

运行结果：

到此这篇关于Python常用的正则表达式处理函数详解的文章就介绍到这了，希望大家以后多多支持！

7. python字符串操作集合

把字符串变量和字面值连接起来，组成新的字符串。推荐3个方法：

对字符串进行单个字符索引时，无论是从前往后索引，还是从后往前索引，索引序号一定要在范围内，否则出错。
对字符串进行切片截取时，采用 str[start:end] 的方式。start，end可以正，可以负。且如果start标识的位置大于等于end标识的位置，则截取字符串为空。start，end超出字符串的极限位置，那么就用最值。start默认为0，end默认为字符串长度。

一般的基于文本和行字符串处理，使用sed，awk，grep等工具就可以了，这些命令行工具用起来更便捷，但是也没有python的这些函数强大。比如没法实现非贪婪模式匹配。如下：

把连续的数字提取出来，其他的字符抛弃

python处理字符串，比linux命令要复杂一些，功能也更强大一些。对于简单的处理任务，linux命令已经足够，python为的是一些更复杂的处理操作。如果两者都会，岂不是更好？

8. eval在python中的用法

python中eval函数用法如下：

1、计算字符串中有效的表达式，并返回结果。

2、将字符串转成相应的对象（如list、tuple、dict和string之间的转换）。

3、将利用反引号转换的字符串再反转回对象。

eval函数主要是用来实现python中各种数据类型与str之间的转换。字符串中包含的什么，通过eval函数就可以输出什么。比如字符串里面包含的字典就输出字典，包含的列表就输出列表，但是字符串相应的格式吵蔽缓一定要输入正确，否则会报错。

通常在Python中使用这个函数，可以对一个字符串进行操作，最后返回的是一个表示式中的值，可以通过字符函数，也可以将一个字符串转换成一个列表、元组或者是一个字典。

eval函数的应用

1、字符串转换成列表

刚升模才说了，这个函数是可以将任意的字符串转换成那三种基本的数据类型的。在代码并羡中，a变量存放的是一个字符串类型数据，通过eval函数进行转换，后面b变量存的是列表类型数据。

2、eval返回表达式的值

eavl函数除了对类型进行转换之外，还可以将参数设置为一个表达式，如何对表达式进行返回。

9. Python处理字符串必备方法

字符串是Python中基本的数据类型，几乎在每个Python程序中都会使用到它。

▍1、Slicing

slicing切片，按照一定条件从列表或者元组中取出部分元素（比如特定范围、索引、分割值）

▍2、****strip()

strip()方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。

在使用strip()方法时，默认去除空格或换行符，所以#号并没有去除。

可以给strip()方法添加指定字符，如下所示。

此外当指定内容不在头尾处时，并不会被去除。

第一个前有个空格，所以只会去取尾部的换行符。

最后strip()方法的参数是剥离其值的所有组合，这个可以看下面这个案例。

最外层的首字符和尾字符参数值将从字符串中剥离。字符从前端移除，直到到达一个不包含在字符集中的字符串字符为止。

在尾部也会发生类似的动作。

▍3、****lstrip()

移除字符串左侧指定的字符（默认为空格或换行符）或字符序列。

同样的，可以移除左侧所有包含在字符集中的字符串。

▍4、rstrip()

移除字符串右侧指定的字符（默认为空格或换行符）或字符序列。

▍5、****removeprefix()

Python3.9中移除前缀的函数。

和strip()相比，并不会把字符集中的字符串进行逐个匹配。

▍6、removesuffix()

Python3.9中移除后缀的函数。

▍7、****replace()

把字符串中的内容替换成指定的内容。

▍8、****re.sub()

re是正则的表达式，sub是substitute表示替换。

re.sub则是相对复杂点的替换。

和replace()做对比，使用re.sub()进行替换操作，确实更高级点。

▍9、****split()

对字符串做分隔处理，最终的结果是一个列表。

当不指定分隔符时，默认按空格分隔。

此外，还可以指定字符串的分隔次数。

▍10、****rsplit()

从右侧开始对字符串进行分隔。

▍11、****join()

string.join(seq)。以string作为分隔符，将seq中所有的元素(的字符串表示)合并为一个新的字符串。

▍12、****upper()

将字符串中的字母，全部转换为大写。

▍13、****lower()

将字符串中的字母，全部转换为小写。

▍14、capitalize()

将字符串中的首个字母转换为大写。

▍15、****islower()

判断字符串中的所有字母是否都为小写，是则返回True，否则返回False。

▍16、isupper()

判断字符串中的所有字母是否都为大写，是则返回True，否则返回False。

▍17、****isalpha()

如果字符串至少有一个字符并且所有字符都是字母，则返回 True，否则返回 False。

▍18、isnumeric()

如果字符串中只包含数字字符，则返回 True，否则返回 False。

▍19、isalnum()

如果字符串中至少有一个字符并且所有字符都是字母或数字，则返回True，否则返回 False。

▍20、count()

返回指定内容在字符串中出现的次数。

▍21、****find()

检测指定内容是否包含在字符串中，如果是返回开始的索引值，否则返回-1。

此外，还可以指定开始的范围。

▍22、rfind()

类似于find()函数，返回字符串最后一次出现的位置，如果没有匹配项则返回 -1。

▍23、startswith()

检查字符串是否是以指定内容开头，是则返回 True，否则返回 False。

**
**

▍24、****endswith()

检查字符串是否是以指定内容结束，是则返回 True，否则返回 False。

▍25、****partition()

string.partition(str)，有点像find()和split()的结合体。

从str出现的第一个位置起,把字符串string分成一个3 元素的元组(string_pre_str,str,string_post_str)，如果string中不包含str则 string_pre_str==string。

▍26、center()

返回一个原字符串居中，并使用空格填充至长度width的新字符串。

▍27、ljust()

返回一个原字符串左对齐，并使用空格填充至长度width的新字符串。

▍28、rjust()

返回一个原字符串右对齐，并使用空格填充至长度width的新字符串。

▍29、f-Strings

f-string是格式化字符串的新语法。

与其他格式化方式相比，它们不仅更易读，更简洁，不易出错，而且速度更快！

▍30、swapcase()

翻转字符串中的字母大小写。

▍31、zfill()

string.zfill(width)。

返回长度为width的字符串，原字符串string右对齐，前面填充0。

参考文献： https://mp.weixin.qq.com/s/9cuO-KL3g9ldqRGGZBVnjw

阅读全文

热点内容

游戏服务器php 发布：2024-11-02 10:21:51 浏览：953

家乡编程创发布：2024-11-02 10:11:32 浏览：282

ipad和安卓板玩游戏哪个好发布：2024-11-02 10:02:37 浏览：804

邮箱密码怎么查看发布：2024-11-02 09:59:46 浏览：724

wand应用怎么安卓下载发布：2024-11-02 09:57:46 浏览：80

为什么手机银行密码是8位发布：2024-11-02 09:54:19 浏览：460

win10搭建一个本地服务器发布：2024-11-02 09:53:36 浏览：348

git搭建本地服务器windows 发布：2024-11-02 09:49:23 浏览：783

跳过地址的代理服务器发布：2024-11-02 09:30:03 浏览：388

Linux配置yum源是什么意思发布：2024-11-02 09:18:13 浏览：526

python的字符串处理函数

与python的字符串处理函数相关的资讯