\d \w \s: las 3 clases que localizan todo

Clase 6 de 29Curso de Expresiones Regulares

Contenido del curso

Expresiones Regulares en lenguajes de programación

Resumen

Domina con confianza las clases básicas de expresiones regulares para localizar datos con precisión. Aquí verás cómo usar \d, \w, \s, el punto y las clases entre corchetes para búsquedas potentes en editores como Atom y en lenguajes como Java, JavaScript o PHP, entendiendo sus distintos sabores.

¿Qué clases de expresiones regulares debes dominar?

Las tres clases predefinidas más útiles concentran gran parte del trabajo diario. Permiten encontrar números, caracteres de palabra y espacios, y luego operar sobre lo encontrado con total control.

¿Cómo funciona \d para encontrar números?

  • \d localiza solo dígitos del 0 al 9. Encuentra “4” o “5” aislados sin tocar letras ni signos.
  • Es equivalente a la clase construida [0-9].
  • Para secuencias específicas, encadena repeticiones: tres dígitos seguidos.
\d \d\d\d [0-9]

¿Qué incluye \w y qué excluye?

  • \w agrupa “word characters”: letras A–Z y a–z, dígitos y el guion bajo.
  • Incluye números y “_”. Excluye “:”, “/”, “.”, “@” y “+”.
  • Una cuenta o identificador típico encaja en \w, pero signos de puntuación no.
\w [A-Za-z0-9_]

¿Qué cuenta como \s en whitespace?

  • \s cubre espacios en blanco: espacio común y tab.
  • Los saltos de línea suelen contarse como whitespace (\n, \r), aunque puede variar por sabor de regex y editor.
  • Diferentes sabores cambian detalles, pero la base se mantiene estable.
\s

¿Cómo construir clases de caracteres con rangos y escapes?

Las clases entre corchetes permiten definir rangos finos y combinar símbolos. Así replicas o refinas \d, \w y agregas literales como el punto escapado cuando se necesite.

¿Cuándo usar rangos como [0-9] y [6-9]?

  • Para todos los dígitos: [0-9].
  • Para un subconjunto, por ejemplo del 6 al 9: [6-9].
  • Los rangos hacen búsquedas más puntuales sin enumerar carácter por carácter.
[0-9] [6-9]

¿Cómo replicar \w con una clase construida?

  • Combina letras, dígitos y guion bajo: [A-Za-z0-9_].
  • Puedes extender o reducir el conjunto según tu caso, por ejemplo restringir letras a A–T.
[A-Za-z0-9_] [A-Ta-t0-9_]

¿Cómo escapar metacaracteres como el punto?

  • El punto “.” es un operador que significa “cualquier carácter”.
  • Para buscar el carácter punto literal, escápalo: ..
  • En clases personalizadas, puedes incluirlo escapado para evitar confusiones.
\. [A-Fa-f0-9_\.]

¿Cómo aplicar en editores y distintos sabores de regex?

Verás resultados inmediatos al activar regex en Atom: marca cada ocurrencia para trabajar después sobre lo encontrado. Aunque los sabores de regex varían entre lenguajes, la base aprendida aquí es el backbone que se traslada a Java, JavaScript o PHP.

¿Qué cambia entre sabores y banderas como case sensitive?

  • La esencia es similar, pero cada lenguaje tiene peculiaridades.
  • La sensibilidad a mayúsculas puede activarse o desactivarse: si está activa, necesitarás rangos separados para minúsculas y mayúsculas.
  • Con acentos y “Ñ” podrían surgir diferencias; se resolverán con técnicas específicas del entorno.

¿Cómo detectar hexadecimales con clases y rangos?

  • Un hexadecimal estándar combina A–F, a–f y 0–9.
  • Usa una clase que concentre ese rango.
  • La longitud exacta se controlará con cuantificadores más adelante.
[A-Fa-f0-9]

¿Qué habilidades prácticas refuerzas ahora mismo?

  • Identificar y usar \d, \w, \s con claridad.
  • Construir clases con corchetes y rangos precisos.
  • Escapar metacaracteres como el punto cuando es literal.
  • Ajustar búsquedas por case sensitive o case insensitive.
  • Entender el papel de whitespace, tab y saltos de línea.
  • Adaptar la base a distintos sabores sin perder compatibilidad.

¿Te animas al reto práctico? intenta localizar todos los hexadecimales en tu archivo con una clase bien construida y cuéntame cómo te fue en los comentarios.