Domina con confianza las clases básicas de expresiones regulares para localizar datos con precisión. Aquí verás cómo usar \d, \w, \s, el punto y las clases entre corchetes para búsquedas potentes en editores como Atom y en lenguajes como Java, JavaScript o PHP, entendiendo sus distintos sabores.
¿Qué clases de expresiones regulares debes dominar?
Las tres clases predefinidas más útiles concentran gran parte del trabajo diario. Permiten encontrar números, caracteres de palabra y espacios, y luego operar sobre lo encontrado con total control.
¿Cómo funciona \d para encontrar números?
\d localiza solo dígitos del 0 al 9. Encuentra “4” o “5” aislados sin tocar letras ni signos.
Es equivalente a la clase construida [0-9].
Para secuencias específicas, encadena repeticiones: tres dígitos seguidos.
\d\d\d\d[0-9]
¿Qué incluye \w y qué excluye?
\w agrupa “word characters”: letras A–Z y a–z, dígitos y el guion bajo.
Incluye números y “_”. Excluye “:”, “/”, “.”, “@” y “+”.
Una cuenta o identificador típico encaja en \w, pero signos de puntuación no.
\w[A-Za-z0-9_]
¿Qué cuenta como \s en whitespace?
\s cubre espacios en blanco: espacio común y tab.
Los saltos de línea suelen contarse como whitespace (\n, \r), aunque puede variar por sabor de regex y editor.
Diferentes sabores cambian detalles, pero la base se mantiene estable.
\s
¿Cómo construir clases de caracteres con rangos y escapes?
Las clases entre corchetes permiten definir rangos finos y combinar símbolos. Así replicas o refinas \d, \w y agregas literales como el punto escapado cuando se necesite.
¿Cuándo usar rangos como [0-9] y [6-9]?
Para todos los dígitos: [0-9].
Para un subconjunto, por ejemplo del 6 al 9: [6-9].
Los rangos hacen búsquedas más puntuales sin enumerar carácter por carácter.
[0-9][6-9]
¿Cómo replicar \w con una clase construida?
Combina letras, dígitos y guion bajo: [A-Za-z0-9_].
Puedes extender o reducir el conjunto según tu caso, por ejemplo restringir letras a A–T.
[A-Za-z0-9_][A-Ta-t0-9_]
¿Cómo escapar metacaracteres como el punto?
El punto “.” es un operador que significa “cualquier carácter”.
Para buscar el carácter punto literal, escápalo: ..
En clases personalizadas, puedes incluirlo escapado para evitar confusiones.
\.[A-Fa-f0-9_\.]
¿Cómo aplicar en editores y distintos sabores de regex?
Verás resultados inmediatos al activar regex en Atom: marca cada ocurrencia para trabajar después sobre lo encontrado. Aunque los sabores de regex varían entre lenguajes, la base aprendida aquí es el backbone que se traslada a Java, JavaScript o PHP.
¿Qué cambia entre sabores y banderas como case sensitive?
La esencia es similar, pero cada lenguaje tiene peculiaridades.
La sensibilidad a mayúsculas puede activarse o desactivarse: si está activa, necesitarás rangos separados para minúsculas y mayúsculas.
Con acentos y “Ñ” podrían surgir diferencias; se resolverán con técnicas específicas del entorno.
¿Cómo detectar hexadecimales con clases y rangos?
Un hexadecimal estándar combina A–F, a–f y 0–9.
Usa una clase que concentre ese rango.
La longitud exacta se controlará con cuantificadores más adelante.
[A-Fa-f0-9]
¿Qué habilidades prácticas refuerzas ahora mismo?
Identificar y usar \d, \w, \s con claridad.
Construir clases con corchetes y rangos precisos.
Escapar metacaracteres como el punto cuando es literal.
Ajustar búsquedas por case sensitive o case insensitive.
Entender el papel de whitespace, tab y saltos de línea.
Adaptar la base a distintos sabores sin perder compatibilidad.
¿Te animas al reto práctico? intenta localizar todos los hexadecimales en tu archivo con una clase bien construida y cuéntame cómo te fue en los comentarios.