代码收藏家技术教程 2025-01-23

Python的re模块中常用字符匹配方法

在 Python 的 re 模块中，除了 match、search 和 findall，还有一些其他常用的正则匹配方法。以下是对常用正则匹配方法的详细总结与对比，包括它们的功能、返回值和使用场景。

1. `re.match`

功能：

从字符串的 起始位置 开始匹配正则表达式。如果字符串的开始部分符合模式，则返回匹配对象；否则返回 None。

返回值：

匹配成功时，返回一个 re.Match 对象。

匹配失败时，返回 None。

常用场景：

检查字符串是否以某个模式开头。

示例：

import re
result = re.match(r"Hello", "Hello World")
if result:
    print(result.group())  # 输出: Hello

2. `re.search`

功能：

扫描整个字符串，查找第一个匹配的子串。

返回值：

匹配成功时，返回一个 re.Match 对象。

匹配失败时，返回 None。

常用场景：

查找字符串中是否存在匹配项，不关心位置。

示例：

import re
result = re.search(r"\d+", "There are 42 apples")
if result:
    print(result.group())  # 输出: 42

3. `re.findall`

功能：

查找字符串中所有匹配正则表达式的子串，返回一个列表。

返回值：

匹配成功时，返回一个包含所有匹配子串的列表。

匹配失败时，返回空列表 []。

常用场景：

提取字符串中所有符合模式的子串。

示例：

import re
result = re.findall(r"\d+", "2024 apples, 2025 bananas")
print(result)  # 输出: ['2024', '2025']

4. `re.finditer`

功能：

与 findall 类似，但返回的是一个迭代器，每次返回一个匹配对象，可以通过 group() 方法获取具体的匹配内容。

返回值：

返回一个迭代器，包含所有匹配项的 re.Match 对象。

常用场景：

需要更多信息（如匹配位置等）时，使用 finditer 会返回一个迭代器，可以进一步操作每个匹配项。

示例：

import re
result = re.finditer(r"\d+", "There are 2024 apples and 2025 bananas")
for match in result:
    print(match.group())  # 输出: 2024, 2025

5. `re.sub`

功能：

用于替换字符串中的匹配部分，将匹配到的子串替换为指定的内容。

返回值：

返回替换后的新字符串。

常用场景：

用于替换匹配到的子串，常见于清洗数据时。

示例：

import re
result = re.sub(r"\d+", "NUMBER", "The year is 2024.")
print(result)  # 输出: The year is NUMBER.

6. `re.split`

功能：

根据正则表达式将字符串分割成多个部分，返回一个列表。

返回值：

返回分割后的字符串列表。

常用场景：

用于按模式分割字符串，常见于分割日志或数据字符串。

示例：

import re
result = re.split(r"\s+", "Hello   World   Python")
print(result)  # 输出: ['Hello', 'World', 'Python']

7. `re.fullmatch`

功能：

从头到尾检查整个字符串是否完全匹配正则表达式。如果整个字符串完全符合模式，则返回匹配对象；否则返回 None。

返回值：

匹配成功时，返回一个 re.Match 对象。

匹配失败时，返回 None。

常用场景：

确保字符串的整个内容与正则模式完全匹配。

示例：

import re
result = re.fullmatch(r"\d+", "2024")
if result:
    print(result.group())  # 输出: 2024

对比：`match`、`search`、`findall`、`finditer`、`sub`、`split` 和 `fullmatch`

方法	功能	返回值	用途
`re.match`	从头开始匹配正则表达式	`re.Match` 或 `None`	检查字符串开头是否符合模式
`re.search`	扫描整个字符串查找匹配项	`re.Match` 或 `None`	查找字符串中是否存在匹配项
`re.findall`	查找所有匹配的子串	匹配子串的列表	提取所有匹配的子串
`re.finditer`	查找所有匹配的子串（迭代器）	匹配对象的迭代器	提取所有匹配的子串，获取更多信息
`re.sub`	替换匹配的子串	替换后的字符串	用于替换匹配到的子串
`re.split`	按正则分割字符串	分割后的字符串列表	按模式分割字符串
`re.fullmatch`	匹配整个字符串	`re.Match` 或 `None`	确保字符串完全匹配正则表达式

总结

re.match：从字符串的开头匹配，适用于检查是否从指定位置开始匹配。

re.search：扫描整个字符串，查找第一个匹配项。

re.findall：返回所有匹配的子串，适用于提取多个匹配项。

re.finditer：与 findall 类似，返回迭代器，可获得更多关于匹配项的信息。

re.sub：用于替换匹配项，常用于数据清洗或字符串转换。

re.split：根据正则表达式分割字符串，适用于数据切分。

re.fullmatch：确保整个字符串与模式完全匹配。

根据需求选择合适的函数，可以更高效地处理字符串匹配、替换和分割等操作。

作者：壹屋安源

物联沃分享整理
物联沃-IOTWORD物联网 » Python的re模块中常用字符匹配方法

代码收藏家普通

分享到：

1. re.match

功能：

返回值：

常用场景：

示例：

2. re.search

功能：

返回值：

常用场景：

示例：

3. re.findall

功能：

返回值：

常用场景：

示例：

4. re.finditer

功能：

返回值：

常用场景：

示例：

5. re.sub

功能：

返回值：

常用场景：

示例：

6. re.split

功能：

返回值：

常用场景：

示例：

7. re.fullmatch

功能：

返回值：

常用场景：

示例：

对比：match、search、findall、finditer、sub、split 和 fullmatch

总结

代码收藏家 普通

相关推荐

发表回复 取消回复

1. `re.match`

2. `re.search`

3. `re.findall`

4. `re.finditer`

5. `re.sub`

6. `re.split`

7. `re.fullmatch`

对比：`match`、`search`、`findall`、`finditer`、`sub`、`split` 和 `fullmatch`

代码收藏家普通

发表回复取消回复