Expresiones Regulares en Python para Análisis de Datos
Clase 25 de 29 • Curso de Expresiones Regulares
Contenido del curso
- 5

Uso de Expresiones Regulares para Buscar y Reemplazar Texto
09:55 - 6

Búsqueda Avanzada con Expresiones Regulares: Clases y Caracteres
13:55 - 7

Operadores en Expresiones Regulares: Asterisco, Más e Interrogación
17:42 - 8

Contadores en Expresiones Regulares: Uso y Aplicaciones Prácticas
14:03 - 9

Expresiones Regulares: Uso de Lazy Matching en CSVs
07:47 - 10

Negación de Clases y Construcción de Expresiones Regulares
06:49 - 11

Expresiones Regulares para Filtrar Números Telefónicos
01:06 - 12

Expresiones Regulares para Procesar Archivos CSV Masivos
08:00
- 13

Expresiones Regulares para Análisis de Logs UNIX
07:22 - 14

Expresiones Regulares para Validar URLs y Dominios Web
08:07 - 15

Creación de Expresiones Regulares para Validación de Teléfonos
12:30 - 16

Validación de Correos Electrónicos con Expresiones Regulares
13:42 - 17

Expresiones Regulares para Coordenadas Geográficas
17:16 - 18

Validación de Nombres Propios y Apellidos en Regex
03:21
- 20

Extracción de Variables en URLs con Expresiones Regulares
10:49 - 21

Uso de Expresiones Regulares en Perl, PHP, Python y JavaScript
03:29 - 22

Extracción de Información con Expresiones Regulares en Perl
23:35 - 23

Expresiones Regulares en PHP: Filtrado de Datos CSV
09:30 - 24

Análisis de Datos de Partidos de Fútbol con Expresiones Regulares
16:26 - 25

Expresiones Regulares en Python para Análisis de Datos
21:58 - 26

Lectura de Archivos en Java con BufferReader
07:59 - 27

Expresiones Regulares en Java: Búsqueda y Filtrado de Datos
08:48 - 28

Validación de Emails con JavaScript y Expresiones Regulares
17:35 - 29

Expresiones Regulares en Línea de Comandos UNIX y Windows
08:18
¿Qué es Python y por qué es tan popular?
Python es uno de los lenguajes de programación más solicitados y utilizados en la actualidad, especialmente en el ámbito de las ciencias de datos. Se destaca por su rapidez, potencia y, sobre todo, por ser amistoso y abierto en cuanto a sintaxis, lo que lo diferencia de otros lenguajes como PHP o C. Aunque tiene algunas limitaciones, sus ventajas superan con creces a sus limitaciones.
Dentro del ecosistema Unix, es común encontrar scripts que inician especificando el intérprete de Python para su ejecución directa. Esto se logra a través de la línea de apertura usando #! en scripts, seguido de la ruta al intérprete de Python, por ejemplo, #!/usr/bin/python.
¿Cómo trabajar con expresiones regulares en Python?
Las expresiones regulares son una herramienta poderosa para buscar y manipular texto. Python permite compilar expresiones regulares para optimizar su rendimiento usando el módulo re. Aquí se muestra un ejemplo básico de cómo utilizar expresiones regulares para procesar un archivo CSV:
import re
# Compilación de la expresión regular
patron = re.compile(r"^\d{4}-(.*)")
# Abre el archivo y procesa línea por línea
with open("files/results.csv", "r") as f:
for linea in f:
resultado = patron.match(linea)
if resultado:
print("Año encontrado:", resultado.group(1))
¿Cómo mejorar el procesamiento de datos con Python?
Usar expresiones regulares permite extraer y manipular datos complejos de manera eficiente. Aquí se ilustra cómo extraer información de un archivo detallando los partidos amistosos:
# Compilar expresiones para filtrar partidos "friendly"
patron_friendly = re.compile(r"^\d{4}.*friendly.*")
# Procesamiento del archivo para encontrar coincidencias
with open("files/results.csv", "r") as f:
for linea in f:
if patron_friendly.match(linea):
print("Partido amistoso:", linea.strip())
Extracción y manipulación de resultados
Python nos permite no solo extraer información, sino también manipularla para obtener estadísticas precisas, como el número total de goles en partidos:
# Expresión regular que captura más detalles
patron_goles = re.compile(r"(\d{2})-(\d{2}),.*,\d+-\d+,")
# Sumar y filtrar partidos con más de 10 goles
with open("files/results.csv", "r") as f:
for linea in f:
res = patron_goles.match(linea)
if res:
local, visitante = int(res.group(1)), int(res.group(2))
total_goles = local + visitante
if total_goles > 10:
print(f"Goles: {total_goles} en {linea.strip()}")
¿Por qué las expresiones regulares son tan valiosas?
Las expresiones regulares son una herramienta sumamente valiosa para cualquier programador, ya que permiten manejar de manera flexible patrones específicos dentro de cadenas de texto. Son especialmente útiles para tareas como:
- Validar formatos de datos.
- Extraer información específica de cadenas complejas.
- Transformar datos antes de su procesamiento.
Aplicaciones prácticas en servidores web
En configuraciones de servidores web, como Apache o Nginx, las expresiones regulares se utilizan comúnmente para analizar las URLs y dirigir las solicitudes adecuadamente, optimizando el rendimiento sin necesidad de capas adicionales de procesamiento en el backend.
Por último, te animamos a seguir explorando las capacidades de Python y sus expresiones regulares, ya que rápidamente se convertirán en una de las herramientas más versátiles y poderosas a tu disposición. ¡Adelante y explora todas sus posibilidades!