Parseo de Let Statements en Lenguaje Platzi

Clase 15 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes

Resumen

¿Cómo parsear 'let statements' en el lenguaje de programación Platzi?

En el proceso de crear nuestro propio lenguaje de programación, encontramos que hay dos tipos fundamentales de statements: los 'let statements' y los 'return statements'. Aquí, nos enfocaremos en entender cómo parsear los 'let statements', esenciales para asignar valores a variables. Imagina que el proceso completo se asemeja a la construcción de un árbol, donde el nodo principal es el programa que contiene varios 'statements'.

¿Qué estructura tiene un 'let statement'?

Un 'let statement' se compone de:

Identificador: Corresponde al nombre de la variable, por ejemplo, 'x' en let x = 5;.
Expresión: Es el valor asignado a la variable, que puede ser un número, un booleano, una función, entre otros.

Ahora bien, para crear un parser que interprete 'let statements', necesitamos definir ciertos nodos y realizar test específicos.

¿Cómo implementamos los nodos para 'let statements'?

Definición de nodos: Debemos crear nodos de tipo 'let statement' e 'identifier'. Esto se logra extendiendo una clase base llamada 'statement'.
Constructor: En el constructor del 'let statement', se recibe un token, un nombre opcional (identifier) y un valor opcional (expression).

Por ejemplo, un nodo 'let statement' se inicializa de la siguiente manera:

class LetStatement(Statement):
    def __init__(self, token, name=None, value=None):
        super().__init__(token)
        self.name = name
        self.value = value

¿Cómo llevar a cabo tests para 'let statements'?

Primero, creamos una función de test para verificar la correcta interpretación de los 'let statements'. La prueba inicializa un lexer y un parser con un programa de prueba:

def test_let_statements():
    input_program = "let x = 5; let y = 10; let foobar = 838383;"
    lexer = Lexer(input_program)
    parser = Parser(lexer)
    program = parser.parse_program()
    assert len(program.statements) == 3

Con estos test, nos aseguramos de que nuestro parser reconoce correctamente los 'let statements' del programa de ejemplo y que estos son almacenados como nodos dentro del árbol de nuestro programa.

¿Cómo funciona el proceso de parsear 'let statements'?

Para parsear los 'let statements', es vital definir las funciones necesarias que verificarán la sintaxis correcta y reconocerán los tokens involucrados:

Advance Tokens: Funciona como un iterador que avanza al siguiente token.
Expected Token: Evalúa si el siguiente token es el esperado de acuerdo a la gramática. Por ejemplo, después de un identificador en un 'let statement', da por hecho que el siguiente debe ser un operador de asignación.

¿Cuáles son los pasos finales para asegurar la correcta interpretación?

Parse Statement: Método que identifica si el token actual representa un 'let statement'.
Parse Let Statement: Método específico para los 'let statements'. Evalúa si la estructura de tokens sigue la sintaxis prevista (ej., let x = 5;).

Por último, la implementación de estas funciones asegura que el parser maneje adecuadamente los errores y solo integre statements con la sintaxis correcta en el programa.

Recomendaciones y siguientes pasos

Al trabajar en el parseo de 'let statements', es crucial implementar técnicas de test driven development (TDD) para asegurar que tu código maneje todo tipo de escenarios. Anímate a explorar más allá y crea tus propios tests. Una vez dominado el parseo de 'let statements', el siguiente reto será integrar el manejo de expresiones complejas y profundizar en 'return statements'. ¡Adelante, tu lenguaje de programación te está esperando!