Las expresiones regulares (regex) son una herramienta poderosa para trabajar con cadenas de texto. Python proporciona el módulo re para trabajar con expresiones regulares.
Paso 1: Importar el módulo re
Antes de poder usar expresiones regulares en Python, debes importar el módulo re
.
import re
Paso 2: Compilar una expresión regular
Puedes compilar una expresión regular usando re.compile(). Esto te permite reutilizar la misma expresión regular varias veces en tu código.
pattern = re.compile(r'\b[A-Za-z]+\b')
En este ejemplo, \b[A-Za-z]+\b es una expresión regular que busca palabras que consisten únicamente en letras.
Paso 3: Buscar coincidencias
Hay varias funciones que puedes usar para buscar coincidencias:
match()
: Verifica si la RE coincide con el comienzo de la cadena.
search()
: Escanea toda la cadena y busca cualquier ubicación donde esta RE coincida.
findall()
: Encuentra todas las subcadenas donde la RE coincide y las devuelve como una lista.
finditer()
: Encuentra todas las subcadenas donde la RE coincide y las devuelve como un iterador de objetos de coincidencia.
Ejemplo con search()
:
text = "Python is fun"match = pattern.search(text)
ifmatch:
print("Found:", match.group())
Ejemplo con findall()
:
matches = pattern.findall(text)
formatchin matches:
print("Found:", match)
Paso 4: Grupos de captura
Puedes usar paréntesis para definir grupos en tu expresión regular. Esto te permite capturar partes dela cadena que coinciden con partes específicas dela RE.
email_pattern = re.compile(r’(\b[A-Za-z0-9._%±]+)@([A-Za-z0-9.-]+.[A-Z|a-z]{2,}\b)’)
match = email_pattern.search(“My email is [[email protected]](mailto:[email protected])”)
ifmatch:
print(“Username:”, match.group(1))
print(“Domain:”, match.group(2))
Paso 5: Reemplazar texto
La función sub()
te permite reemplazar las partes dela cadena que coinciden con la RE.
replaced_text = email_pattern.sub(r’\1[at]\2’, “Contact: [[email protected]](mailto:[email protected])”)
print(replaced_text)```
Esto es solo una introducción básica a las expresiones regulares en Python. Las expresiones regulares son muy potentes y pueden ser bastante complejas, por lo que te recomiendo que consultes la documentación oficial de Python o busques tutoriales más avanzados para profundizar en este tema.