El punto en regex: selecciona cualquier carácter

Clase 5 de 29Curso de Expresiones Regulares

Resumen

Domina las búsquedas en archivos de texto con una base sólida: archivo, línea, cadena y carácter. Verás cómo funciona Control F en Atom, qué hace find and replace y por qué el punto en regex es tan potente al seleccionar cualquier carácter, incluidos los invisibles. Con ejemplos prácticos para contar 10 caracteres seguidos y detectar múltiplos de tres.

¿Qué es un archivo de texto y cómo se compone?

Un archivo de texto sencillo, como un CSV, es una sucesión de líneas. Cada línea es una cadena de caracteres. Puede haber líneas vacías, pero siguen siendo líneas. Un carácter es la representación en bits de un símbolo (comúnmente ASCII). Existen diferentes encodings, tema complejo que aquí no se aborda.

  • Carácter visible e invisible: el espacio o el tab existen aunque no se vean. Algunos editores permiten mostrarlos.
  • Cadena: caracteres en secuencia. Cada carácter ocupa su lugar, incluso los espacios.
  • Línea: una cadena; el archivo es varias líneas concatenadas.

¿Qué es un carácter y qué hay de los invisibles?

  • Espacio y tab: son caracteres reales. Se pueden resaltar si el editor lo permite.
  • Ojo con lo que “no se ve”: pueden alterar conteos y coincidencias.

¿Cómo buscar y reemplazar con y sin expresiones regulares en Atom?

Con Control F se abre el panel inferior de finding current buffer. Ahí se escribe qué buscar y, si se desea, con qué reemplazar. Por defecto, la búsqueda es literal; al activar use regex, se habilitan expresiones regulares.

  • Búsqueda exacta sin regex: encuentra la cadena precisa, por ejemplo “uno, dos”.
  • Reemplazo: con replace all aplicas todos los cambios. Ctrl+Z revierte.
  • Precisión: sin regex no hay patrones, solo coincidencias exactas.

¿Qué cambia al activar regex?

  • Potencia: puedes buscar patrones, no solo texto fijo.
  • Punto (.): coincide con cualquier carácter. Incluye espacio y tab.
  • Selección aparente: parece que selecciona la línea completa, pero realmente es carácter por carácter.

¿Cómo evitar errores al reemplazar?

  • Si usas “.” y reemplazas por “%”, cada carácter se convierte en “%”.
  • Si reemplazas por “%%%”, la línea crece: un carácter se vuelve tres.
  • Verifica tu patrón antes de replace all para no “desbocar el caballo”.

¿Por qué el punto en regex es tan potente y cómo controlarlo?

El punto (.) es una abstracción máxima del texto: un carácter cualquiera. Siempre encontrará algo si hay caracteres. Por eso conviene especificar el contexto cuando sea posible.

  • Patrón “.”: selecciona todos los caracteres.
  • Patrón “. ” (punto seguido de espacio): encuentra cualquier carácter que tenga un espacio después. No importa si es “A ” o “5 ”.
  • Advertencia: usar “.” sin cuidado puede devolver resultados excesivos.

¿Cómo encontrar 10 caracteres seguidos?

  • Si buscas “..........” (diez puntos), localizas diez caracteres consecutivos.
  • Útil para detectar secuencias largas, como cuando se mencionan teléfonos de México de diez posiciones, sin aún distinguir dígitos.
  • Los caracteres invisibles cuentan. Unos espacios extra pueden hacer que aparezca la coincidencia.

¿Qué revela buscar múltiplos de tres?

  • Con “...” (tres puntos), verás coincidencias en grupos de tres a lo largo de una línea.
  • Si una línea “se resalta completa”, significa que su longitud es múltiplo de tres: va marcando 3, 6, 9, etc.

Palabras y acciones clave para practicar:

  • Archivo de texto, línea, cadena, carácter, ASCII, encoding.
  • Atom, Control F, finding current buffer, find and replace, replace all, Ctrl+Z, use regex.
  • Expresiones regulares, regex, punto (.), caracteres invisibles, espacio, tab.
  • Secuencias de 10 caracteres, múltiplos de tres, dígitos y letras (siguiente sesión).

¿Tienes un caso real que quieras detectar con el punto u otro patrón simple? Cuéntalo y probamos juntos cómo armar la búsqueda en tu editor.