Técnicas de Parsing: Top-Down y Bottom-Up

Clase 19 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes

¿Cuáles son las técnicas más populares de parsing?

Según cómo se construya nuestro parsing tree, la estructura de datos en donde almacenaremos los Tokens que se generan al hacer el Análisis léxico de nuestro código fuente o Source Code, tendremos dos grandes tipos de técnicas de Parseo comúnmente utilizadas.

Top-Down Parsing (de arriba hacia abajo).
Bottom-Up Parsing (de abajo hacia arriba).

¿Para qué nos sirve un Parser?

Nos sirve para:

Realizar un análisis de la sintaxis sin importar el contexto.
Guiar el análisis que sí será sensitivo al contexto.
Generar código intermedio.
Reportar errores de sintaxis en caso de existir.
Intentar corregir los errores (en caso que se desee).

En este curso utilizaremos un Top Down Parser, en combinación con la técnica Pratt Parsing.

¿Qué es pratt parsing?

Esta es una técnica que fue originalmente descrita por el Computer Scientist, Vaughn Pratt, en 1973. Cuando estás construyendo un Parser, usar la técnica de “Recursive Descent” o descenso recursivo es una de las más fáciles opciones que puedes tener y funciona de maravilla cuando puedes saber qué hacer después con base en el bloque de código que estás parseando. Esto, por ejemplo, con los statements de tu lenguaje, cuando cuentas con un identificador único, if, for, while, etc.

Sin embargo, se puede complicar cuando llegas a las expresiones, cuando utilizas operadores como +, ++, --, etc. Puede ser difícil de definir qué tipo de expresión estás parseando hasta que ya has avanzado bastante.

Esto lo puedes hacer utilizando descenso recursivo siempre y cuando crees una función única para la operación que busques, como cuando escribes un if para cada posible caso en tu programa. Puede ser tedioso.

También lo podrías hacer a través de bucles hasta que termines de parsear una expresión entera y con esto saber qué harás con ella, esto también es tedioso.

Y justo este es el problema que resolvió Pratt (de hecho, es usado, por ejemplo, en JSLint, la brillante herramienta de análisis de código que revisa si el código fuente en JavaScript que está analizando cumple con ciertas reglas a seguir, ya sabes funciona lo que antes de tomar estos cursos conocías como magia de tu Visual Studio Code).

En pocas palabras (y al ser algo que aprenderás a crear en las próximas clases) te diré lo que es: es un tipo de parsing que utiliza tanto bucles como recursividad para permitirnos manejar asociatividad y precedencia del objeto que estemos analizando.

Carlos Eduardo Gomez García

teacher•

Vale, lo poco que entendí de Pratt Parsing es que básicamente es una técnica de parsing en el cual usamos recursividad y bucles para "dar contexto" a ciertas expresiones 🤔 Esto porque según entiendo, al toparte con ciertos operadores no tienes la seguridad de cuál es la expresión completa que debes parsear hasta que logras tener un panorama más amplio, y para obtener ese panorama es cuando se aplica la recursividad, es complicado de explicar pero imagino que van por ahí los tiros jaja

Raúl Humberto Peñate Ramírez

student•

Veo que es recursividad, o ir en un búcle hasta que ve donde termina la expresión para considerar si todo esta correcto o no.

Victor Alexander De Jesus De Nobrega

student•

En este momento solo se me ocurre que Pratt Parsing puede funcionar en expresiones como el FOR cuando le indicamos de la forma "clásica" como va a funcionar es decir for(int i = 0; i < 3; i++) { } en donde tenemos que saber que el ++ se aplica incrementando en 1 a 'i' luego de ejecutada una iteración del FOR y en caso ++i seria previo a esta iteración. Pero no se del todo si mi intuición va por buen camino

Isaac Reyes

student•

Uuuy, que interesante, me gusta como suena eso

Técnicas de Parsing: Top-Down y Bottom-Up

Introducción al desarrollo de intérpretes y lenguajes de programación

Construcción de Intérpretes de Software en Python 3.8

Creación de Compiladores e Intérpretes con Lenguaje Platzi

Construcción del lexer o tokenizador

Análisis Léxico: Construcción de un Léxer para Intérpretes

Definición de Tokens en Lenguaje de Programación Platzi

Desarrollo de un Lexer con Test-Driven Development

Pruebas de Operadores, Delimitadores y Fin de Archivo en Lexer Python

Lexer: Identificación de Keywords y Tokens Complejos

Reconocimiento de Funciones en Lexer de Lenguaje de Programación

Implementación de Operadores y Condicionales en Lexer de Platzi

Implementación de Operadores de Dos Caracteres en Lexer

Creación de un REPL en Python para Lenguaje de Programación

Construcción del parser o analizador sintáctico

Construcción de un Parser para el Lenguaje Platzi

Definición de Nodos Abstractos para Árbol de Sintaxis (AST) en Python

Desarrollo de un AST en Python: Creación de la Clase Programa

Parseo de Let Statements en Lenguaje Platzi

Implementación de funciones advanced y expected tokens

Manejo de Errores en Parsers con Test Driven Development

Parseo de Return Statements en Lenguaje Platzi

Técnicas de Parsing: Top-Down y Bottom-Up

Pruebas de AST para Let y Return Statements en Parsers

Pratt Parsing: Implementación y Registro de Funciones en Python

Parseo de Identificadores en Lenguajes de Programación

Parseo de Expression Statements en Platzi Parser

Parseo de Enteros en Lenguaje Platzi

Implementación de Operadores Prefijo en Parsers

Operadores InFix en Expresiones: Implementación y Pruebas

Implementación de Operadores InFix en un Parser

Expresiones Booleanas en el Lenguaje de Programación Platzi

Evaluación de Precedencia y Testeo de Booleanos en Parsers

Evaluación de Expresiones Agrupadas en un Parser

Parseo de Condicionales en Lenguaje Platzi

Implementación de Condicionales en Parser de Lenguaje

Parsing de Funciones en Lenguaje Platzi: Creación de Nodos AST

Construcción de nodos de función en un parser AST

Llamadas a Funciones en Lenguajes de Programación

Implementación de llamadas a funciones en un parser con AST

Parseo de Expresiones en LET y RETURN Statements

Implementación de REPL para Árbol de Sintaxis Abstracta

Evaluación o análisis semántico

Evaluación Semántica en Lenguajes de Programación

Estrategias de Evaluación en Lenguajes de Programación

Representación de Nodos AST y Objetos en Python

Evaluación de Expresiones en JavaScript y Python

Implementación del Patrón Singleton para Booleanos y Nulos

Evaluación de Prefijos en Lenguaje de Programación Platzi

Evaluación de Expresiones Infix en Lenguaje Platzi

Evaluación de Condicionales en Lenguaje de Programación Platzi

Evaluación y Uso del Return Statement en Programación

Manejo de Errores Semánticos en Lenguaje Platzi

Declaración y Gestión de Variables en Lenguajes de Programación

Manejo de Ambientes y Variables en Lenguajes de Programación

Declaración de Funciones en Lenguaje de Programación Platzi

Implementación de Llamadas a Funciones en PlatziLang

Mejora del intérprete

Implementación de Strings en un Intérprete de Lenguaje de Programación

Operaciones de Concatenación y Comparación de Strings en Intérprete

Implementación de Funciones Built-in en Python

Implementación de Built-ins en el Lenguaje Platzi

Siguientes pasos

Desarrollo de Lenguaje de Programación y Estructuras de Datos en Python

Construcción de un Intérprete en Python desde Cero