Cuantificadores regex: *, + y ? en acción

Clase 7 de 29 • Curso de Expresiones Regulares

Resumen

Aprende a construir expresiones regulares con seguridad y velocidad: desde clases de caracteres hasta cuantificadores esenciales. Aquí tienes un acordeón tipo cheat sheet (chuleta) que resume lo importante y cómo combinarlo para búsquedas y find/replace potentes.

¿Qué son las clases de caracteres y rangos en regex?

Las clases y rangos definen qué tipo de carácter se puede emparejar. Entenderlas evita pruebas al azar y hace tus patrones confiables.

¿Qué incluye cada clase de caracteres?

\w: clase de “word”. Letras, dígitos y guion bajo. Viene de word.
\d: dígitos. Equivale a [0-9].
\s: espacios en blanco. Espacio, tab y caracteres invisibles.
. (punto): cualquier carácter. Muy potente para “todo”.
Guion bajo (_): parte de la clase de palabra.

¿Cómo se escriben los rangos?

Rango de dígitos: [0-9].
Rango de letras: [A-Z].

\w
\d    == [0-9]
\s
.
[0-9]
[A-Z]

¿Cómo funcionan los cuantificadores greedy en regex?

Los cuantificadores dicen “cuántos” caracteres deben aparecer. Por defecto son greedy: van por todo lo posible.

¿Qué hace cada cuantificador?

*: cero o muchos. Greedy: toma todo lo que pueda.
+: uno o más. Agrupa secuencias completas.
?: cero o uno. Opcional, exacto.

.*     # cualquier cosa, todo.
\d+    # uno o más dígitos.
\d*    # cero o más dígitos.
[A-Z]? # cero o una letra mayúscula.

Con .* el match abarca líneas completas si es posible. Línea a línea, un solo match.
Con \d+, “123” es un solo match, no “1”, “2”, “3” separados.
Con \d*, también empareja “vacío” donde no hay dígitos.
El símbolo de interrogación tiene doble uso en regex: opcionalidad (cero o uno) y modo lazy. Lo segundo se verá más adelante.

¿Cómo combinar clases y cuantificadores para find/replace eficaces?

La fuerza está en mezclar clases con cantidades. Así defines patrones compactos que emparejan justo lo que necesitas y nada más.

¿Cómo exigir u opcionalizar partes del patrón?

Parte obligatoria: carácter sin cuantificador. Ejemplo: la S al final debe estar.
Parte opcional (cero o uno): ?.
Parte repetible: * (cero o muchas) o + (una o más).

\d*[A-Z]?S

\d*: puede haber dígitos o no antes.
[A-Z]?: puede haber una letra (o no) después.
S: obligatoria. No tiene cuantificador.

Variaciones útiles:

\d+[A-Z]?S: debe haber al menos un dígito antes de la S.
\d*[A-Z]S: debe haber una letra antes de la S (no opcional).

¿Qué pasa al reemplazar con replace all?

Sustituir con un guion “-” revela cuántos matches reales hubo.
Con .*, cada línea suele volverse un solo “-” porque el match cubre todo.
Pueden aparecer más reemplazos de los vistos: hay caracteres invisibles (como espacios o tabs) que también emparejan.

find:       \d+
replace:    -
acción:     replace all
resultado:  todas las secuencias numéricas sustituidas por “-”.

Tips prácticos:

Si el case no coincide, ajusta tu búsqueda según convenga.
El punto . con * es potente pero amplio: úsalo con intención.
Piensa primero en lenguaje natural: “cero o muchos”, “uno o más”, “cero o uno”. Luego tradúcelo a *, +, ?.

¿Te quedó alguna duda puntual o quieres proponer un patrón real de tu trabajo para pulirlo juntos? Deja tu comentario y lo resolvemos paso a paso.

Comentarios

David Behar

student•

Acordeones finales del curso

David Santiago González Ramos

student•

Woooooow,esto esta genial! Es un gran aporte, muchas gracias!

Mateo Nieto Hoyos

student•

Gracias, muy buen aporte!

Julio J Yépez

student•

¡Encontré este sitio , en el que se puede ver el flujo lógico de las expresiones regulares!

Para este patrón:

\d*[a-z]?s\d+

El flujo lógico de la expresión regular sería el siguiente:

Ivan Santiago

student•

Muy cool 😄

También checa esta pagina:

Kevin Morales

student•

También esta

Jeffersson Muñoz Torres

student•

Hice estos apuntes de lo que entendí a mi parecer hasta ahora y pude probar en https://regex101.com/ Espero que a alguien como yo, que vio el vídeo como 3 veces para comprender el uso de los delimitadores, le pueda ayudar :)

Gomez

student•

Excelente

Yolanda Jiménez

student•

Hola! Muchas gracias por tu resumen! Lo estoy siguiendo y está claro.

Quería añadir unos puntos a tus ejemplos:

En el caso de /d*[a-t] el resultado sería:

12345Texto la T no entra porque es mayúscula, en cambio la e y la o también la selecciona porque está dentro del rango.

Para tener ese resultado debería ser: [0-9]*[a-tA-T]

Pasa igual en el resto de ejemplos, hay que añadir las mayúsculas a la búsqueda. [a-tA-T] y en el caso de ? también se seleccionan la e y la o

David Daniel Castillo Nava

student•

Delimitadores:

(*) : Cero o más veces
(?): Cero o una sola vez
(+): una o más veces.

Aplican al carácter o sentencia que preceden

[a-z]? : Esto es que puede estar una sola vez o no estar una letra minuscula de la (a) a la (z).
\d*: Esto es que puede estar muchas veces o no estar un digito.
\d+: Esto es que puede estar muchas veces o una sola vez un digito.

Julio J Yépez

student•

Cheat-sheet … acordeón … guacho … chuleta XD
Es el material de apoyo encubierto por “excelencia” en los exámenes de la escuela XD

Juan Carlos Pinzón

student•

Chancuco creo que sería en Colombia, si es que hablamos de los mismo jeje

Gustavo Gonzalez

student•

Machete en Argentina!

leonardo Oteca

student•

Pablo Antonio Rodríguez Montero

student•

++Cuantificación en expresiones regulares:++ ? -> El signo de interrogación indica que el carácter que le precede puede aparecer como mucho una vez. Por ejemplo, “ob?scuro” se corresponde con oscuro y obscuro. + -> El signo más indica que el carácter que le precede debe aparecer al menos una vez. Por ejemplo, “ho+la” describe el conjunto infinito hola, hoola, hooola, hoooola, etcétera. * -> El asterisco indica que el carácter que le precede puede aparecer cero, una, o más veces. Por ejemplo, “0*42” se corresponde con 42, 042, 0042, 00042, etcétera.

André Almanza Herrera

student•

Muchas gracias por tu aporte, tus ejemplos son muy buenos, me sirvieron para comprender mejor la clase :)

Jeinfferson Bernal G

student•

Gracias!

Edward Toledo López

student•

+ --> 1 o más. Incluye solo si aparece este dato

*--> 0 o más No importa en sí, pero estaría bueno que sí lo encontraras sin importar cuantas veces te salgan.

? --> 0 o 1 vez. No importa si no lo encuentras, pero si lo haces, SOLO ME SIRVE UNA VEZ, el resto está de más.

Jose Luis Campos Bautista

student•

Recomiendo esta lectura Denial of Service, para cuando diseñen un regex y evitemos las vulnerabilidadescomo por ejemplo el ataque Denial of Service - ReDoS.

Kepa Aristi Achaga

student•

- ".*" --> Todos los caractéres, busca todos. El * es cero o más.
- "\d*" --> Todos los dígitos.
- "\d+" --> Todos los dígitos. Es uno o más.
- "\d?" --> Todos los dígitos. Uno o cero.

Ejemplos:

- "\d+[a-z]" -> Encuentrame todo lo que tenga uno o más dígitos y al final tiene una letra.
- "\d*[a-z]" -> Encuentrame todo lo que teniendo dígitos o no, al final tiene una letra.

Mariana Valencia Gallego

student•

Wow! Esta clase sí me voló la cabeza

José Eduardo Ramos Silva

student•

Luis Ruiz Ramos

student•

Esto se va a descontrolaaaaaaaaarrrrr.

Grupo Logis

student•

Recomiendo el siguiente website para seguir y entender mas claro como funcionan las REGEXR

!Example

Joseph Darwin Carhuaz Villagomez

student•

Una observación que viene de la clase anterior.
El \w encuentra también caracteres alfabétidos tildados incluyendo la letra eñe si estamos en español (Habría que probar si ubica otros caracteres alfabéticos especiales en otros idiomas. Pero al usar el rango [0-9a-zA-Z_] la búsqueda es más estricta y no incluyen los caracteres especiales ya que basándonos en la tabla ASCII una ‘á’ tildada por ejemplo no se encuentra entre la letra ‘a’ y la ‘z’ o entre la ‘A’ y la ‘Z’.

Francisco Javier Rodriguez Gomez

student•

Saludos @jcarhuazv, no se cual motor de expresiones regulares estes usando, pero en los que he trabajado:

\w equivale a [a-zA-Z0-9_] es decir, no incluye la ñ ni vocales con tilde.

María José Medina

student•

Entonces los delimitadores van del lado derecho de la expresión y se leen de derecha a izquierda. Ejemplos:

\d* → 0 o más dígitos.
[a-z]? → 0 o 1 letra minúscula.
\s+ → 1 o más espacios.

H NA

student•

Tendiendo el patrón que usa Beco:

\d*[a-z]?s\d*

No entiendo porque encuentra el fragmento “sys” de la palabra system.

Según entiendo:

Busca cero a mas dígitos.
Busca cero o una letra (solo una vez) entre la a-z.
Seguido de lo anterior debe existir de manera obligatoria la letra “s”.
Nuevamente cero o mas dígitos.

Por lo que en la palabra “system”:

No encuentra ningún dígito.
2 y 3) Encuentra la letra “y” antes de la letra “s”.
No encuentra ningún dígito.

No debería solo marcar “ys” en la palabra “system”. No entiendo esa parte.

Javier Alejandro Alamar Martínez

student•

Tengo la misma duda

Javier Alejandro Alamar Martínez

student•

Ya entendí, si te fijas, el “?” nos dice que encuentre una letra o ninguna
entonces el match es " s" -> un espacio y una s
no es que junte las 3.
por que “ys” es otro match !

JHON HABACUC CHAVEZ GARCIA

student•

\w - caracteres de palabras \d - digitos \s - espacios/invisibles en blanco [0-9] ~ \d [0-9a-zA-Z] ~ \w

greedy - todo

uno o mas ? cero o uno \d*[a-z]?s\d*

Jose Miguel Garzón Vargas

student•

*Los delimitadores: +, , ?

* → Haya o no haya [Seleccionar todo, operador greedy]

Ejemplo: \d*[a-tA-T]

Se lee: Seleccione el carácter que se encuentra en el rango de la a a la t, (Tanto minúsculas como mayúsculas) y TODOS los números que lo preceden, EXISTAN O NO.

Así, del siguiente ejemplo seleccionará

12345Texto 12345 Texto

+→Haya uno o más [Debe haber]

Ejemplo: \d+[a-tA-T]

Se lee: Seleccione las secuencias de caracteres que contengan AL MENOS UN dígito, seguido de un carácter que se encuentre en el rango de la a a la t, (Tanto minúsculas como mayúsculas).

Así pues, del siguiente ejemplo seleccionará

12345Texto 12345 Texto

?→Haya cero o uno (Puede haber sólo uno)

Ejemplo: \d?[a-tA-T]

Se lee: Seleccione las secuencias de caracteres QUE CONTENGAN O NO, UN SOLO dígito, seguido de un carácter que se encuentre en el rango de la a a la t, (Tanto minúsculas como mayúsculas).

Así pues, del siguiente ejemplo seleccionará

12345Texto 12345 Texto

Ejemplo complejo: \[[a-zA-Z]*:?@+[a-zA-Z]*\]

Se lee: Seleccione las secuencias de caracteres que:

Comiencen con el carácter especial [
Seguidamente contengan, o no, una secuencia de letras tanto minúsculas como mayúsculas.
Seguidamente contengan, o no, un solo carácter :
Seguidamente contengan al menos un @
Seguidamente contengan, o no, una secuencia de letras tanto minúsculas como mayúsculas.
Finalicen con el carácter especial ]

Así pues, del siguiente ejemplo seleccionará

[LOG ENTRY] [LOG] Everything is OK [LOG ENTRY] [LOG] [:@beco] Logged in [LOG ENTRY] [LOG] [USER:@beco] Clicked here [LOG ENTRY] [LOG] [user@@@@] Rated the app [LOG ENTRY] [LOG] [user:@beco] Logged out [LOG ENTRY] [LOG] [user:beco] test

Ricardo Celis

teacher•

( * ) Todo. Cero o muchos. El profe dice 0 o 1

Lala Mercado

student•

Venía de esta clase : https://platzi.com/clases/1468-bash-shell/16970-expresiones-regulares/ Dónde están las descripciones de los criterios de las expresiones regulares… así nomás:

*.- Caracter que representa cero o más ocurrencias de la expresión

+.- Caracter que representa una o más ocurrencias de la expresión.

{n}.-Representa n veces de una expresión.

[ ] .- Representa un conjunto de caracteres, por ejemplo: [a-z] representa las letras del abecedario de la a a la z.

bueno acá después de 7 clases me han quedado claras :) , gracias!!

Cuantificadores regex: *, + y ? en acción

Introducción a las Expresiones Regulares

Expresiones regulares sin misterio ni miedos

Por qué las regex son simples

Expresiones regulares: búsqueda por patrones

Cómo buscar teléfonos y tarjetas con regex

El lenguaje: caracteres, operadores, y construcciones

El punto en regex: selecciona cualquier carácter

\d \w \s: las 3 clases que localizan todo

Cuantificadores regex: *, + y ? en acción

Contadores en expresiones regulares

Greedy vs lazy en regex: cuándo usar cada uno

Negaciones con gorrito en expresiones regulares

Cómo detectar números telefónicos sin letras

Cómo procesar archivos CSV con millones de líneas

Uso práctico de Expresiones Regulares

Filtrar logs gigantes con expresiones regulares

Expresiones regulares para URLs HTTP

Regex para validar teléfonos con separadores y extensiones

Validación de emails con regex

Validación de coordenadas GPS con regex

Validar nombres propios con regex

Usos avanzados en Expresiones Regulares

Grupos de captura para transformar CSV a SQL

Expresiones Regulares en lenguajes de programación

Cómo extraer variables de URLs con regex

Regex en múltiples lenguajes con CSV real

Perl: CSV de fútbol en cero segundos

Expresiones regulares en PHP: preg_match con CSV

Extraer empates de archivos masivos con PHP

Python regex para análisis de archivos CSV

Lectura de archivos con BufferedReader en Java

Escapar regex en Java: doble barra

Validación de emails en JavaScript con regex

Grep: filtra archivos masivos con regex