python re.split函数

  • Post category:Python

当我们需要将字符串根据某种模式进行分割时,可以用Python标准库中的re模块的split()函数实现。下面是Python中re.split()函数的详细讲解。

函数的定义

re.split(pattern, string, maxsplit=0, flags=0)

split()函数按照正则表达式的模式分隔字符串,将分割后的结果以列表形式返回。其中,pattern是一个正则表达式,string是需要分割的字符串,maxsplit是可选参数,用于指定最大分割次数。flags是可选参数,用于指定正则表达式的匹配模式。

函数的返回值

split()函数的返回值是一个列表,列表中的元素是分割后的字符串。

实例1

下面是一个简单的示例,将字符串按照逗号进行分割:

import re

string = "apple,banana,orange,pear"
result = re.split(",", string)
print(result)

输出结果:

['apple', 'banana', 'orange', 'pear']

在上面的例子中,split()函数接受了两个参数,第一个参数是正则表达式“,”,表示根据逗号进行分割;第二个参数是字符串”apple,banana,orage,pear”。函数返回一个列表,列表中的元素是分割后的字符串。

实例2

下面是一个稍微复杂一点的示例,将字符串按照多个符号进行分割:

import re

string = "apple--banana:orange:pear"
result = re.split("--|:|", string)
print(result)

输出结果:

['apple', 'banana', 'orange', 'pear']

在上面的例子中,split()函数接受了两个参数,第一个参数是正则表达式”–|:|”, 表示根据”–“、”:”和空字符进行分割;第二个参数是字符串”apple–banana:orange:pear”。函数返回一个列表,列表中的元素是分割后的字符串。

总结

split()函数是一个非常实用的函数,可以根据正则表达式分割字符串,这在文本处理当中很有用。我们需要注意的是,正则表达式中的分隔符可以是一个字符串、一个字符组,也可以是一个特殊的字符序列,例如:空字符、换行符等,我们可以根据自己的需求任选其一。