# 核心概念

# 概述

Python re库是一个正则表达式库，主要用于处理字符串匹配和搜索。它包含一些核心类和核心函数以及方法，下面是它们的简单介绍：

# 核心类

re.Pattern: 正则表达式的编译结果，包含了正则表达式的解析结果，可以用来进行匹配操作。
re.Match: 匹配结果，包含匹配的起始和结束位置等信息，可以用来提取匹配结果。

# 核心函数

re.compile(): 将正则表达式编译成一个re.Pattern对象。
re.match(): 从字符串的起始位置开始尝试匹配正则表达式，如果成功返回一个re.Match对象，否则返回None。
re.search(): 扫描整个字符串，尝试匹配正则表达式，如果成功返回一个re.Match对象，否则返回None。
re.findall(): 返回一个列表，包含字符串中所有匹配正则表达式的子串。
re.finditer(): 返回一个迭代器，迭代器的每个元素都是一个re.Match对象，表示字符串中一个匹配正则表达式的子串。

re.sub

import re

text = "Hello, my name is John. I like programming and John."

def to_uppercase(match):
    return match.group().upper()

pattern = r'John'
new_text = re.sub(pattern, to_uppercase, text)

print("Original Text:", text)
print("New Text:", new_text)

# 核心方法

re.Pattern.match(): 从字符串的起始位置开始尝试匹配正则表达式，如果成功返回一个re.Match对象，否则返回None。
re.Pattern.search(): 扫描整个字符串，尝试匹配正则表达式，如果成功返回一个re.Match对象，否则返回None。
re.Pattern.findall(): 返回一个列表，包含字符串中所有匹配正则表达式的子串。
re.Pattern.finditer(): 返回一个迭代器，迭代器的每个元素都是一个re.Match对象，表示字符串中一个匹配正则表达式的子串。
re.Match.group(): 返回整个匹配对象或指定子组的匹配字符串。
re.Match.groups(): 返回所有子组匹配字符串的元组。
re.Match.groupdict(): 返回一个字典，包含所有命名捕获组的子组匹配字符串。
re.Match.start(): 返回匹配子串在原字符串中的起始位置。
re.Match.end(): 返回匹配子串在原字符串中的结束位置。
re.Match.span(): 返回一个元组，包含匹配子串在原字符串中的起始和结束位置。

‍

← 命名捕获组 tiktoken - 计算Token →