Pratt Parsing: Implementación y Registro de Funciones en Python
Clase 21 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes
Resumen
¿Qué es el parsing Pratt y cómo se aplica?
El parsing Pratt es una técnica popular de parsing descendente, desarrollada por el creador Pratt Baum. A través de él, vamos construyendo iterativamente el árbol abstracto de sintaxis (AST) desde el comienzo del programa. Esta técnica se ha vuelto muy conocida, especialmente gracias a su uso en parsers importantes como el de JSON.
El parsing Pratt se vincula estrechamente con el lenguaje de programación JavaScript. Cuando trabajamos con un parseador JSON en JavaScript o Python, lo que hacemos es convertir un string en una estructura de datos, por ejemplo, un objeto con propiedades.
¿Cómo se asignan funciones a los tokens?
Una de las características más prominentes del parsing Pratt es que asigna funciones específicas a cada token. Estas funciones pueden ser de dos tipos: infix (infijo) o prefix (prefijo). Por ejemplo:
- Prefix: El operador "not" o el prefijo "-" signifique negación.
- Infix: El operador "-" representa una resta entre dos números.
La posición del operador es fundamental. Por ejemplo, un llamado a función donde el paréntesis de apertura actúa como operador infix en una expresión.
¿Cómo se implementan tipos con alias en Python?
Para hacer nuestro código más legible, usamos alias para identificar si tratamos con una función de prefijo o infijo. En Python, podemos crear alias de tipo utilizando el módulo typing
. Aquí unos ejemplos:
from typing import Callable, Optional, Dict
# Alias para funciones de prefijo
PrefixParseFunction = Callable[[], Optional['Expression']]
# Alias para funciones de infijo
InfixParseFunction = Callable[['Expression'], Optional['Expression']]
# Diccionario para funciones de prefijo
PrefixParseFunctions = Dict['TokenType', PrefixParseFunction]
# Diccionario para funciones de infijo
InfixParseFunctions = Dict['TokenType', InfixParseFunction]
¿Cómo registramos funciones de parsing?
Al inicializar el parser, es fundamental registrar las funciones que se ejecutarán para cada tipo de token. Implementamos listas que permitirán llenar estos diccionarios con las funciones de parsing correspondientes.
class Parser:
def __init__(self):
self.prefix_parse_functions = self.register_prefix_functions()
self.infix_parse_functions = self.register_infix_functions()
def register_prefix_functions(self) -> PrefixParseFunctions:
return {}
def register_infix_functions(self) -> InfixParseFunctions:
return {}
Esto forma la infraestructura básica para parsers, permitiéndonos más adelante establecer conexiones entre token types
y funciones específicas.
¿Qué consideraciones se tienen al usar parsing Pratt?
Dentro del parsing Pratt, es crucial tener presente el siguiente token usando peek_token
. Este aspecto es vital para verificar si el orden sintáctico de los tokens es correcto. El proceso iterativo de parsing es un viaje de ajustes y mejora. Las dudas iniciales que se presenten serán esclarecidas a medida que se avanza en el aprendizaje y desarrollo del parser.
Aunque la complejidad del tema puede parecer intimidante, el parsing Pratt ofrece las herramientas necesarias para hacer un análisis sintáctico eficiente. Es emocionante explorar más sobre estas técnicas y cómo se pueden aplicar en la vida profesional. Únete a esta exploración compartiendo tus experiencias y los tipos de parsing que has encontrado en tu trayectoria. ¡El aprendizaje no se detiene!