Subcadena más larga sin caracteres repetidos: patrón ventana deslizante

Clase 20 de 35Curso de Algoritmos Avanzados: Patrones de Arrays y Strings

Contenido del curso

Dos Apuntadores

Resumen

Encontrar la subcadena más larga sin caracteres repetidos es uno de los problemas clásicos que pone a prueba tu dominio del patrón ventana deslizante (sliding window). Este ejercicio, conocido como longest substring without repeating characters, aparece con frecuencia en entrevistas técnicas y es ideal para practicar cómo optimizar soluciones hasta alcanzar una complejidad temporal O(n).

¿En qué consiste el problema de la subcadena más larga sin repetir caracteres?

Dada una cadena de texto S, el objetivo es determinar la longitud de la subcadena más larga que no contenga caracteres repetidos [0:22]. No se pide devolver la subcadena en sí, sino únicamente su longitud.

Por ejemplo, con la entrada ABCABCBB:

  • La subcadena ABC tiene longitud 3.
  • Al llegar a la segunda A, el carácter se repite y la subcadena debe reiniciarse.
  • Otras combinaciones posibles como BCA o CAB también tienen longitud 3.
  • Ninguna subcadena sin repeticiones supera esa longitud, por lo que la respuesta es 3 [0:37].

El mismo razonamiento aplica para cadenas más largas: se recorre el texto buscando la ventana de mayor tamaño donde todos los caracteres sean únicos.

¿Por qué importa la longitud y no la subcadena?

El problema pide exclusivamente un valor numérico. Esto simplifica la implementación porque no necesitas almacenar ni comparar cadenas completas, solo rastrear qué caracteres están dentro de tu ventana actual y cuál es el tamaño máximo alcanzado [1:03].

¿Cómo se aplica el patrón ventana deslizante a este problema?

El patrón ventana deslizante consiste en mantener dos punteros que definen los límites de una sección de la cadena. A medida que avanzas:

  • Expandes la ventana moviendo el puntero derecho para incluir un nuevo carácter.
  • Contraes la ventana moviendo el puntero izquierdo cuando detectas un carácter repetido.
  • En cada paso, actualizas la longitud máxima registrada.

Este enfoque permite recorrer la cadena una sola vez, logrando la complejidad temporal O(n) que se plantea como reto [1:14]. Para verificar si un carácter ya existe dentro de la ventana, puedes utilizar un set o un hash map, estructuras que ofrecen búsqueda e inserción en tiempo constante.

¿Qué pasos seguir antes de implementar?

Antes de escribir código, es fundamental diseñar la solución en papel o pseudocódigo [1:20]:

  • Define claramente los dos punteros (inicio y fin de la ventana).
  • Elige la estructura de datos para rastrear caracteres vistos.
  • Establece las condiciones para expandir y contraer la ventana.
  • Identifica cuándo y cómo actualizar la longitud máxima.

Este paso de diseño previo te ayuda a evitar errores comunes como no manejar correctamente el reinicio de la ventana cuando aparece un carácter duplicado.

¿Por qué buscar una solución O(n) y no una más simple?

Una solución por fuerza bruta revisaría todas las posibles subcadenas, lo que resulta en una complejidad de O(n²) o peor. Con el patrón ventana deslizante, cada carácter se visita como máximo dos veces (una al expandir y otra al contraer), garantizando un rendimiento lineal. Esta diferencia es crítica cuando las cadenas de entrada son muy largas.

Intenta diseñar tu propia solución con complejidad O(n) antes de ver la implementación. Comparte en los comentarios cómo fue tu proceso y qué estructura de datos elegiste para rastrear los caracteres dentro de la ventana.