Por qué las regex son simples

Clase 2 de 29 • Curso de Expresiones Regulares

Contenido del curso

Introducción a las Expresiones Regulares

El lenguaje: caracteres, operadores, y construcciones

Uso práctico de Expresiones Regulares

Usos avanzados en Expresiones Regulares

19
Grupos de captura para transformar CSV a SQL
17:39 min

Expresiones Regulares en lenguajes de programación

Tomar examen

Resumen

Las expresiones regulares no tienen por qué ser intimidantes. Con patrones claros y una intención definida, permiten separar lo útil de lo irrelevante en grandes volúmenes de texto. Aquí verás cómo pensar en patrones, decidir cuándo un string hace match y cómo eso impacta en la limpieza de datos, la eficiencia y la lógica de negocio.

¿Por qué las expresiones regulares simplifican el filtrado de datos?

Crear una regex es construir un patrón que acepta o rechaza cadenas. La idea es directa: iteras línea por línea en un CSV, haces una prueba de match, y decides si procesas o descartas. La metáfora de colores y formas ilustra cómo definir criterios de selección sin enredarte en tecnicismos.

Patrón por colores: quedarse solo con azul, verde, rojo y anaranjado.
Iteración línea a línea en un CSV para limpieza de datos.
Si hace match: se procesa o se trata de forma especial.
Si no hace match: se descarta por no cumplir la lógica de negocio.

¿Qué significa diseñar un patrón?

Un patrón puede centrarse en lo que necesitas: letras de la A a la J, de la J a la V, solo dígitos o palabras que empiezan con mayúscula. También puede ignorar “colores” y enfocarse solo en “formas”: aceptar lo que coincide estructuralmente y rechazar lo demás según tu objetivo.

¿Cómo opera el match en la iteración?

Cada línea entra al proceso, se compara con el patrón y se decide. Si el patrón es adecuado, incluso un caso con una fecha 2018 incrustada puede coincidir. La clave es el control: ser tan específico o tan laxo como la tarea lo requiera.

¿Cómo equilibrar patrones estrictos y laxos?

Puedes diseñar un patrón más estricto centrado en la forma y otro más laxo centrado en atributos generales. Por ejemplo, un patrón que ignora el color y valida la forma puede aceptar varias piezas distintas; otro, más laxo, aceptará por color sin mirar la forma. Esa elección define qué entra y qué descartas.

Patrón por forma: sin importar el color si la estructura coincide.
Uso de dígitos, caracteres especiales, solo ASCII o no ASCII según convenga.
Especificidad ajustable: define qué “cabe” y qué no para tu objetivo.
Ejemplo ilustrativo: una línea con “2018” puede entrar si el patrón lo permite.

¿Cuándo descartar para ganar eficiencia?

Descartar lo que no sirve ahorra CPU y memoria. En archivos grandes, filtrar temprano con regex simplifica el procesamiento y evita lógica manual extensa. Lo que no hace match se excluye antes de afectar el rendimiento.

¿Cómo extraer datos tras el match?

Además de confirmar coincidencias, muchas implementaciones permiten extraer datos al hacer match. Si una línea de CSV tiene siete columnas, puedes quedarte con la columna 3 y 4 para operar directamente. Así reduces pasos y trabajas con la parte exacta que necesitas.

¿Qué ventajas ofrecen en lenguajes y validaciones comunes?

Las expresiones regulares están disponibles como módulo o librería en prácticamente todos los lenguajes. Sirven tanto en backend como en frontend para tomar partes importantes de texto y, sobre todo, para descartar ruido con rapidez y precisión.

Validación de correo electrónico sin lógica manual de dividir por arroba y puntos.
Patrón único que define el formato exacto, sin importar proveedor: Gmail, Hotmail o Yahoo.
Casos útiles: dominio, latitud y longitud, fechas y valores numéricos.

¿Qué habilidades desarrollas al practicarlas?

Construir patrones ajustados a la lógica de negocio.
Iterar y decidir entre aceptar o descartar datos.
Simplificar limpieza de CSV con reglas claras.
Pensar en niveles de estrictez frente a patrones más laxos.
Optimizar recursos al evitar procesamiento innecesario.

¿Qué casos prácticos se trabajan?

Leer y validar un mail con un patrón exacto.
Tomar un dominio de un string para usarlo después.
Reconocer latitud y longitud en texto para operar con esos valores.

¿Con qué patrón te gustaría empezar a filtrar o validar tus datos en texto? Comparte tu caso y lo exploramos juntos.

Comentarios

César Espinoza García

student•

Se ganó mi like, buen hombre. Al despertar, el día de hoy, no sabía que desconocía la existencia del término 'expresiones regulares' y me fui a dormir aprendiendo algo nuevo. Estaré tomando el curso una vez termine los que tengo pendientes. PS. no se si soy el único que vino gracias al link de una clase del curso de Introducción a la Terminal.

Julian Crispin

student•

YO tambien vengo de ese curso, me hace falta presentar el examen

Lisbeth Diaz

student•

Justo ahora acabo de terminar ese curso.

Andrés Madrigal

student•

Esencial para el web scraping

Josué David Díaz Blanco

student•

Exacto, en el trabajo la usamos con headless browsers para obtener datos o para herramientas que tenemos para SEO, para cosas como obtener los links de un texto plano de HTML.

Emerson Cedeño

student•

“… Alguno de los usos del web scraping son la comparación de precios en tiendas, la monitorización de datos relacionados con el clima de cierta región, la detección de cambios en sitios webs y la integración de datos en sitios webs.” -wikipedia

… lo vengo escuchando desde hace un buen tiempo, aquí en Platzi hay algún curso que abarque esta técnica?, hay algún lenguaje más recomendado sobre otro para trabajarla?

Martin Paez

student•

Las expresiones regulares son patrones de caracteres que te permite ir seleccionando o descartando datos en un archivo de texto como por ejemplo csv, o en una línea o un input, según coincidan o nó con este patrón.

Debes ser muy selectivo y especifico en ellas para encontrar lo que verdadermente necesitas.

Son filtros extremadamente poderosos y puntuales.

Ignacio Crespo

student•

Excelente resumen en muy pocas líneas! Gracias!

Kenyi Julberht Hancco Quispe

student•

Excelente explicacion

Fernando Reyes

student•

Expresiones Regulares, son patrones en los que definimos que cadenas de caracteres entran o no entran en el patrón diseñado.
Además de ser útiles para quedarnos con parte de la información que necesitamos y descartamos la que no.

Ignacio Basilio

student•

Buen resumen.

Matias Acosta

student•

Buen resumen, gracias

John J. Meza

student•

Este curso debería ir en la ruta de data science

Jeinfferson Bernal G

student•

De acuerdo contigo!

Julián Cárdenas

student•

y sí va!

Luis Fernando Méndez González

student•

Podemos por tanto definir las Expresiones regulares como los patrones para encontrar datos y seleccionarlos o descartarlos a lo largo de archivos, ya sean de texto plano de informacion (muy util si pensamos en bases de datos) o en líneas de código o inputs (muy útil si pensamos en la parte de desarrollo) siendo extremadamente potente por su rapidez y eficiencia, siendo soportada por diversas librerías en muchísimos lenguajes de programación

Oscar Jaramillo

student•

Jeinfferson Bernal G

student•

jejejeje. muy buena imagen!

Luis Antonio Arce Paredes

student•

Con las expresiones regulares podemos ahorrar el uso del CPU.

Gustavo Casimiro Pinzon

student•

también ahorra memoria y lo mas importante para mi, tiempo a ti y del usuario

Julio J Yépez

student•

Sí, ya que las expresiones regulares se ejecutan a un más bajo nivel que las funciones de cadena estándar … incluso en algunos lenguajes de programación las expresiones regulares se compilan antes de usarlas por lo cual las comparaciones parecieran incluso hacerse a nivel de bits y no sólo de cadenas! … creo

Sebastián Melo

student•

Me salte el curso de arquitectura xd, porque quiero echar código y no podía esperar.

Oscar Jaramillo

student•

Braulio Rangel

student•

👍

Julián Cárdenas

student•

Genial!

Carlos José González Juan

student•

¿Qué son las expresiones regulares y para qué son útiles? Las expresiones regulares pueden ser todo lo complicado que uno quiera, pero en realidad son muy sencillas de crear. Es ir creando patrones donde cadenas de caracteres vayan entrando o no entrando. Y estos patrones van a ir atacando una línea o un input, siempre y cuando sea una cadena de caracteres. Solo van a mirar una línea de un archivo a la vez. Cuando hacemos un patrón de expresiones regulares, comparamos ese patrón línea a línea, quedándonos con las que son iguales al patrón, y dejando las que no se parecen. Una vez que se han comparado todas las líneas con el patrón, ya se pueden operar con los datos con los que nos hemos quedado. Hay que ser cuidadoso con las expresiones regulares, ser tan específicos y estrictos como necesitemos. Las expresiones regulares son muy útiles tanto para quedarnos con partes de textos importantes, en el backend o en el frontend, pero es tanto o más importante lo que vamos descartando, ya que, si tenemos archivos gigantes, con mucha información basura, nos es muy fácil limpiarlo con las expresiones regulares. Al limpiar estos archivos estamos ahorrando de una manera impresionante espacio en los discos, tiempo de procesamiento, etc. Una de las ventajas de las expresiones regulares es que estan atadas a casi todos los lenguajes de programación. Todos los lenguajes tienen una librería o un módulo de este tipo. Con las expresiones regulares vamos a hacer selección o descarte de datos que quiero o no quiero en mi programa. Otra de las ventajas es que, tras extraer los datos, podemos operar directamente con ellos.

Braulio Rangel

student•

graxias, 👍

Miguel Angel Reyes Moreno

student•

Guía Fácil y Completa de Expresiones Regulares desde Cero

Seguro que el vídeo de Falcon Masters ayudará también mucho en el curso :)

Braulio Rangel

student•

👍

Braulio Rangel

student•

viendo el video 😎

Oscar Jaramillo

student•

Julián Cárdenas

student•

Excelente!

Josan Guerra

student•

Guía para entender y usar expresiones regulares:

Jorge Méndez Ortega

student•

Adoro las explicaciones de esta manera son geniales.

Jose Manuel Montaño Saenz

student•

ser estricto con las expresiones regulares, y muy cuidadosos con lo que buscas.

JAVIERTH LISNERTH ENRIQUE ARAUCO

student•

Las expresiones regulares están atadas a casi cualquier lenguaje!

Julián Cárdenas

student•

Yeah, that's right!

Omar Rodríguez Aldama

student•

Las expresiones regulares (regex) son patrones que se utilizan para buscar y manipular cadenas de texto. Aquí tienes una tabla básica de regex con algunas expresiones comunes y su significado:

Patrón	Descripción
`.`	Coincide con cualquier carácter
`*`	Coincide con 0 o más repeticiones del anterior
`+`	Coincide con 1 o más repeticiones del anterior
`?`	Coincide con 0 o 1 repetición del anterior
`^`	Indica el inicio de una línea
`$`	Indica el final de una línea
`[abc]`	Coincide con cualquier carácter dentro de los corchetes
`[^abc]`	Coincide con cualquier carácter que no esté en los corchetes
`\d`	Coincide con cualquier dígito (0-9)
`\D`	Coincide con cualquier carácter que no sea un dígito
`\w`	Coincide con cualquier carácter alfanumérico
`\W`	Coincide con cualquier carácter que no sea alfanumérico
`\s`	Coincide con cualquier espacio en blanco
`\S`	Coincide con cualquier carácter que no sea espacio

Esta tabla puede ser un punto de partida útil para trabajar con expresiones regulares en tus proyectos.

Javier Ramos

student•

Excelente aporte Gracias por compartirlo

Isaías Fernández

student•

Que son y para que se utilizan los archivos .CSV?

Juan Jiménez

student•

La extensión de archivo .CSV significa Comma Separated Values (Valores separados por comas). El formato es utilizado en muchos programas de bases de datos, hojas de cálculo y gestores de contactos para almacenar listas de información.

Luis Lira

student•

Hola, son archivos que sus columnas están separados por comas. Se puede usar para diferentes propósitos, algunas bases de datos también te ofrecen exportar a este formato la información que desees para luego cargarla en otro lugar y se organice tal y como la tenías. También puede ser para archivos de configuración sencillos, etc.

Hinder Adrian Alvarez Perlaza

student•

Ni siquiera sabía que existía tanta técnica en el tema de las expresiones regulares. ¡Genial!

Patrón

Descripción

.

Coincide con cualquier carácter

*

Coincide con 0 o más repeticiones del anterior

+

Coincide con 1 o más repeticiones del anterior

?

Coincide con 0 o 1 repetición del anterior

^

Indica el inicio de una línea

$

Indica el final de una línea

[abc]

Coincide con cualquier carácter dentro de los corchetes

[^abc]

Coincide con cualquier carácter que no esté en los corchetes

\d

Coincide con cualquier dígito (0-9)

\D

Coincide con cualquier carácter que no sea un dígito

\w

Coincide con cualquier carácter alfanumérico

\W

Coincide con cualquier carácter que no sea alfanumérico

\s

Coincide con cualquier espacio en blanco

\S

Coincide con cualquier carácter que no sea espacio

Por qué las regex son simples

Introducción a las Expresiones Regulares

Expresiones regulares sin misterio ni miedos