以下是详细讲解“Python3单行多行万能正则匹配方法”的完整攻略,包括单行和多行正则匹配的方法和两个示例说明。
单行正则匹配
单正则匹配是指在单行文本中匹配正表达式。在Python中,我们可以使用re
模块的search
函数单行正则匹配。
下面是一个例子,演示如何使用单行正则匹配:
import re
text = 'hello world'
pattern = r'hello\s\w+'
result = re.search(pattern, text)
if result:
print(result.group())
在上面的代码中,我们使用re.search
函数进行单行正则匹配。这个正则表达式使用hello\s\w+
匹配hello
后面的空格和一个或多个单词。然后,我们使用if
语句判断是否匹配成功,并输出结果。
多行正则匹配
多行正则匹配是指在多行文本中匹配正则表达式。在Python中,我们可以使用re
模块的search
函数和DOTALL
标志进行多行正则匹配。
下面是一个例子,演示如何使用多行正则匹配:
import re
text = 'hello\nworld'
pattern = r'hello.*world'
result = re.search(pattern, text, re.DOTALL)
if result:
print(result.group())
在上面的代码中,我们使用re.search
函数和DOTALL
标志进行多行正则匹配。这个正则表达式使用hello.*world
匹配hello
和world
之间的任意字符,包括换行符。然后,我们使用if
语句判断是否匹配成功,并输出结果。
示例说明
示例1:使用单行正则匹配提取电子邮件
下面是一个例子,演示如何使用单行正则匹配提取电子邮件地址:
import re
text = 'My email john@example.com'
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
result = re.search(pattern, text)
if result:
print(result.group())
在上面的代码中,我们使用单行正则匹配提取子件地址。这个正则表达式使用\b
匹单词边界,使用[A-Za-z0-9._%+-]+
配用户名,使用@[A-Za-9.-]+\.[A-Z|a-z]{2,}
匹配域名。然后,我们使用if
语句判断是否匹配成功,并输出结果。
示例2:使用多行正则匹配提取HTML中的链接
下面是一个例子,演示如何使用多行正则匹配提取HTML中的链接:
import re
html = '<a href="https://www.example.com">Example</a>'
pattern = r'<a\s+href="([^"]+)"'
result = re.search(pattern, html, re.DOTALL)
if result:
print(result.group(1))
在上面的代码中,我们使用多行正则匹配提取HTML中的链接。这个正则表达式使用<a\s+href="([^"]+)"
匹配<a>
标签中的href
属性值。然后,我们使用if
语句判断是否匹配成功,并输出结果。
以上是Python3单行多行万能正则匹配方法的完整攻略,包括单行和多行正则匹配的方法和两个示例说明。实际应用中,我们可以根据需要灵活运用正则表达式,实现各种复杂的文本处理任务。