Técnicas de Parsing: Top-Down y Bottom-Up
Clase 19 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes
Contenido del curso
Construcción del lexer o tokenizador
- 3

Análisis Léxico: Construcción de un Léxer para Intérpretes
05:36 min - 4

Definición de Tokens en Lenguaje de Programación Platzi
11:53 min - 5

Desarrollo de un Lexer con Test-Driven Development
15:43 min - 6

Pruebas de Operadores, Delimitadores y Fin de Archivo en Lexer Python
10:01 min - 7

Lexer: Identificación de Keywords y Tokens Complejos
18:57 min - 8

Reconocimiento de Funciones en Lexer de Lenguaje de Programación
07:46 min - 9

Implementación de Operadores y Condicionales en Lexer de Platzi
12:38 min - 10

Implementación de Operadores de Dos Caracteres en Lexer
12:08 min - 11

Creación de un REPL en Python para Lenguaje de Programación
12:35 min
Construcción del parser o analizador sintáctico
- 12

Construcción de un Parser para el Lenguaje Platzi
05:22 min - 13

Definición de Nodos Abstractos para Árbol de Sintaxis (AST) en Python
09:14 min - 14

Desarrollo de un AST en Python: Creación de la Clase Programa
12:49 min - 15

Parseo de Let Statements en Lenguaje Platzi
20:21 min - 16

Implementación de funciones advanced y expected tokens
08:26 min - 17

Manejo de Errores en Parsers con Test Driven Development
11:06 min - 18

Parseo de Return Statements en Lenguaje Platzi
12:42 min - 19

Técnicas de Parsing: Top-Down y Bottom-Up
Viendo ahora - 20

Pruebas de AST para Let y Return Statements en Parsers
12:06 min - 21

Pratt Parsing: Implementación y Registro de Funciones en Python
11:47 min - 22

Parseo de Identificadores en Lenguajes de Programación
13:29 min - 23

Parseo de Expression Statements en Platzi Parser
16:34 min - 24

Parseo de Enteros en Lenguaje Platzi
14:03 min - 25

Implementación de Operadores Prefijo en Parsers
16:43 min - 26

Operadores InFix en Expresiones: Implementación y Pruebas
10:40 min - 27

Implementación de Operadores InFix en un Parser
20:20 min - 28

Expresiones Booleanas en el Lenguaje de Programación Platzi
13:00 min - 29

Evaluación de Precedencia y Testeo de Booleanos en Parsers
08:39 min - 30

Evaluación de Expresiones Agrupadas en un Parser
10:16 min - 31

Parseo de Condicionales en Lenguaje Platzi
13:50 min - 32

Implementación de Condicionales en Parser de Lenguaje
12:05 min - 33

Parsing de Funciones en Lenguaje Platzi: Creación de Nodos AST
15:51 min - 34

Construcción de nodos de función en un parser AST
15:43 min - 35

Llamadas a Funciones en Lenguajes de Programación
13:05 min - 36

Implementación de llamadas a funciones en un parser con AST
12:21 min - 37

Parseo de Expresiones en LET y RETURN Statements
07:58 min - 38

Implementación de REPL para Árbol de Sintaxis Abstracta
08:59 min
Evaluación o análisis semántico
- 39

Evaluación Semántica en Lenguajes de Programación
03:42 min - 40

Estrategias de Evaluación en Lenguajes de Programación
09:18 min - 41

Representación de Nodos AST y Objetos en Python
14:17 min - 42

Evaluación de Expresiones en JavaScript y Python
19:39 min - 43

Implementación del Patrón Singleton para Booleanos y Nulos
11:52 min - 44

Evaluación de Prefijos en Lenguaje de Programación Platzi
14:41 min - 45

Evaluación de Expresiones Infix en Lenguaje Platzi
18:07 min - 46

Evaluación de Condicionales en Lenguaje de Programación Platzi
13:50 min - 47

Evaluación y Uso del Return Statement en Programación
14:42 min - 48

Manejo de Errores Semánticos en Lenguaje Platzi
21:05 min - 49

Declaración y Gestión de Variables en Lenguajes de Programación
13:55 min - 50

Manejo de Ambientes y Variables en Lenguajes de Programación
11:57 min - 51

Declaración de Funciones en Lenguaje de Programación Platzi
12:26 min - 52

Implementación de Llamadas a Funciones en PlatziLang
23:55 min
Mejora del intérprete
Siguientes pasos
¿Cuáles son las técnicas más populares de parsing?
Según cómo se construya nuestro parsing tree, la estructura de datos en donde almacenaremos los Tokens que se generan al hacer el Análisis léxico de nuestro código fuente o Source Code, tendremos dos grandes tipos de técnicas de Parseo comúnmente utilizadas.
-
Top-Down Parsing (de arriba hacia abajo).
-
Bottom-Up Parsing (de abajo hacia arriba).
¿Para qué nos sirve un Parser?
Nos sirve para:
- Realizar un análisis de la sintaxis sin importar el contexto.
- Guiar el análisis que sí será sensitivo al contexto.
- Generar código intermedio.
- Reportar errores de sintaxis en caso de existir.
- Intentar corregir los errores (en caso que se desee).
En este curso utilizaremos un Top Down Parser, en combinación con la técnica Pratt Parsing.
¿Qué es pratt parsing?
Esta es una técnica que fue originalmente descrita por el Computer Scientist, Vaughn Pratt, en 1973. Cuando estás construyendo un Parser, usar la técnica de “Recursive Descent” o descenso recursivo es una de las más fáciles opciones que puedes tener y funciona de maravilla cuando puedes saber qué hacer después con base en el bloque de código que estás parseando. Esto, por ejemplo, con los statements de tu lenguaje, cuando cuentas con un identificador único, if, for, while, etc.
Sin embargo, se puede complicar cuando llegas a las expresiones, cuando utilizas operadores como +, ++, --, etc. Puede ser difícil de definir qué tipo de expresión estás parseando hasta que ya has avanzado bastante.
Esto lo puedes hacer utilizando descenso recursivo siempre y cuando crees una función única para la operación que busques, como cuando escribes un if para cada posible caso en tu programa. Puede ser tedioso.
También lo podrías hacer a través de bucles hasta que termines de parsear una expresión entera y con esto saber qué harás con ella, esto también es tedioso.
Y justo este es el problema que resolvió Pratt (de hecho, es usado, por ejemplo, en JSLint, la brillante herramienta de análisis de código que revisa si el código fuente en JavaScript que está analizando cumple con ciertas reglas a seguir, ya sabes funciona lo que antes de tomar estos cursos conocías como magia de tu Visual Studio Code).
En pocas palabras (y al ser algo que aprenderás a crear en las próximas clases) te diré lo que es: es un tipo de parsing que utiliza tanto bucles como recursividad para permitirnos manejar asociatividad y precedencia del objeto que estemos analizando.