Algoritmo Python para Substring más Largo Sin Repeticiones

Clase 23 de 35Curso de Algoritmos Avanzados: Patrones de Arrays y Strings

Resumen

¿Cómo podemos encontrar el Longest Substring Without Repeating Characters?

En este artículo, nos sumergimos en la implementación del algoritmo para encontrar el Longest Substring Without Repeating Characters utilizando Python. Este problema puede parecer complejo si se enfrenta de forma incorrecta, pero utilizando estructuras y tácticas adecuadas, podemos resolverlo de manera eficiente. ¡Vamos a descubrir cómo hacerlo!

¿Cómo iniciamos el desarrollo del algoritmo?

Comenzamos definiendo las variables necesarias para implementar nuestro algoritmo:

  • inicio: un apuntador inicializado en cero que ayudará a definir el comienzo de la ventana deslizante que revisaremos.
  • fin: otro apuntador que recorrerá el string, pero que no es necesario inicializar explícitamente al principio, ya que avanzará automáticamente con cada iteración.
  • caracteres_a_posicion: un diccionario que almacenará la posición más reciente de cada carácter en el string.
  • mayor_longitud: un entero que almacenará la longitud del substring más largo encontrado sin caracteres repetidos.

¿Cómo administramos la detección de duplicados?

Para detectar la repetición de caracteres, seguimos los pasos descritos a continuación:

  1. Iteración del string: Recorremos cada carácter del string con el apuntador fin.
  2. Revisión de duplicados: Si el carácter ya está en caracteres_a_posicion y su posición es mayor o igual al inicio actual, esto indica un duplicado y, por tanto, actualizamos el inicio al índice siguiente al de la última aparición del duplicado.
  3. Actualización de la posición: Independientemente de que haya un duplicado o no, actualizamos la posición de cada carácter en caracteres_a_posicion.
  4. Comparación de longitud: Calculamos la longitud del substring actual (fin - inicio + 1) y la comparamos con mayor_longitud, actualizando este último si es necesario.

El código para este algoritmo en Python es el siguiente:

def longest_substring_without_repeating_characters(s):
    inicio = 0
    caracteres_a_posicion = {}
    mayor_longitud = 0
    
    for fin in range(len(s)):
        caracter_actual = s[fin]
        
        if caracter_actual in caracteres_a_posicion and inicio <= caracteres_a_posicion[caracter_actual]:
            inicio = caracteres_a_posicion[caracter_actual] + 1
        
        caracteres_a_posicion[caracter_actual] = fin
        mayor_longitud = max(mayor_longitud, fin - inicio + 1)
    
    return mayor_longitud

¿Qué complejidades nos encontramos en el algoritmo?

La eficiencia del algoritmo se ve reflejada en dos tipos de complejidades:

  • Complejidad temporal: Es O(n), donde n es el número de caracteres en el string. Esto se debe a que recorremos el string solo una vez y utilizamos operaciones de búsqueda y almacenamiento constantes.

  • Complejidad espacial: Es O(n) en el peor caso, ya que el diccionario caracteres_a_posicion puede llegar a almacenar todos los caracteres del string si todos son distintos.

Este desarrollo nos muestra cómo podemos enfrentar problemas de algoritmos en principio complejos, utilizando un enfoque sistemático y eficiente. Los invitamos a seguir aprendiendo y reforzando habilidades de programación para resolver desafíos de forma efectiva. ¡El aprendizaje nunca termina!