Implementación de Strings en un Intérprete de Lenguaje de Programación
Clase 53 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes
Contenido del curso
- 3

Análisis Léxico: Construcción de un Léxer para Intérpretes
05:36 - 4

Definición de Tokens en Lenguaje de Programación Platzi
11:53 - 5

Desarrollo de un Lexer con Test-Driven Development
15:43 - 6

Pruebas de Operadores, Delimitadores y Fin de Archivo en Lexer Python
10:01 - 7

Lexer: Identificación de Keywords y Tokens Complejos
18:57 - 8

Reconocimiento de Funciones en Lexer de Lenguaje de Programación
07:46 - 9

Implementación de Operadores y Condicionales en Lexer de Platzi
12:38 - 10

Implementación de Operadores de Dos Caracteres en Lexer
12:08 - 11

Creación de un REPL en Python para Lenguaje de Programación
12:35
- 12

Construcción de un Parser para el Lenguaje Platzi
05:22 - 13

Definición de Nodos Abstractos para Árbol de Sintaxis (AST) en Python
09:14 - 14

Desarrollo de un AST en Python: Creación de la Clase Programa
12:49 - 15

Parseo de Let Statements en Lenguaje Platzi
20:21 - 16

Implementación de funciones advanced y expected tokens
08:26 - 17

Manejo de Errores en Parsers con Test Driven Development
11:06 - 18

Parseo de Return Statements en Lenguaje Platzi
12:42 - 19
Técnicas de Parsing: Top-Down y Bottom-Up
01:46 - 20

Pruebas de AST para Let y Return Statements en Parsers
12:06 - 21

Pratt Parsing: Implementación y Registro de Funciones en Python
11:47 - 22

Parseo de Identificadores en Lenguajes de Programación
13:29 - 23

Parseo de Expression Statements en Platzi Parser
16:34 - 24

Parseo de Enteros en Lenguaje Platzi
14:03 - 25

Implementación de Operadores Prefijo en Parsers
16:43 - 26

Operadores InFix en Expresiones: Implementación y Pruebas
10:40 - 27

Implementación de Operadores InFix en un Parser
20:20 - 28

Expresiones Booleanas en el Lenguaje de Programación Platzi
13:00 - 29

Evaluación de Precedencia y Testeo de Booleanos en Parsers
08:39 - 30

Evaluación de Expresiones Agrupadas en un Parser
10:16 - 31

Parseo de Condicionales en Lenguaje Platzi
13:50 - 32

Implementación de Condicionales en Parser de Lenguaje
12:05 - 33

Parsing de Funciones en Lenguaje Platzi: Creación de Nodos AST
15:51 - 34

Construcción de nodos de función en un parser AST
15:43 - 35

Llamadas a Funciones en Lenguajes de Programación
13:05 - 36

Implementación de llamadas a funciones en un parser con AST
12:21 - 37

Parseo de Expresiones en LET y RETURN Statements
07:58 - 38

Implementación de REPL para Árbol de Sintaxis Abstracta
08:59
- 39

Evaluación Semántica en Lenguajes de Programación
03:42 - 40

Estrategias de Evaluación en Lenguajes de Programación
09:18 - 41

Representación de Nodos AST y Objetos en Python
14:17 - 42

Evaluación de Expresiones en JavaScript y Python
19:39 - 43

Implementación del Patrón Singleton para Booleanos y Nulos
11:52 - 44

Evaluación de Prefijos en Lenguaje de Programación Platzi
14:41 - 45

Evaluación de Expresiones Infix en Lenguaje Platzi
18:07 - 46

Evaluación de Condicionales en Lenguaje de Programación Platzi
13:50 - 47

Evaluación y Uso del Return Statement en Programación
14:42 - 48

Manejo de Errores Semánticos en Lenguaje Platzi
21:05 - 49

Declaración y Gestión de Variables en Lenguajes de Programación
13:55 - 50

Manejo de Ambientes y Variables en Lenguajes de Programación
11:57 - 51

Declaración de Funciones en Lenguaje de Programación Platzi
12:26 - 52

Implementación de Llamadas a Funciones en PlatziLang
23:55
¿Cómo se añaden strings a un intérprete?
Crear un intérprete funcional requiere varios pasos y uno de ellos es la implementación de las estructuras de datos que acostumbramos ver en los lenguajes de programación, como los strings. Integrar strings en un intérprete implica tratarlos como secuencias de caracteres. Para hacerlo, debemos recorrer todo el pipeline del intérprete: generar nuevos tokens, modificar el lexer, crear nodos de AST, ajustar el parser y modificar el evaluador para que reconozca este nuevo tipo de nodo. En este contexto, desarrollar tests para cada una de estas partes constituye un paso vital para garantizar el correcto funcionamiento del intérprete.
¿Qué pasos se siguen para modificar el lexer?
El lexer es responsable de convertir el source code en una lista de tokens que el resto del intérprete pueda procesar. Incluir soporte para strings en el lexer implica:
- Definir un nuevo tipo de token que pueda identificar características específicas de las cadenas, como las comillas dobles que las delimitan.
- Leer una secuencia completa de caracteres desde el inicio hasta el cierre de las comillas dobles usando un método que pueda extraer el string en sí.
- Crear tests que verifiquen que el lexer genera los tokens esperados al procesar strings, como se demuestra en el siguiente pseudocódigo:
# Pseudocódigo básico para representación
def test_string():
source = '"foo"; "Platzi es la mejor escuela de CS";'
tokens_esperados = [
Token(type="STRING", value="foo"),
Token(type="SEMICOLON"),
Token(type="STRING", value="Platzi es la mejor escuela de CS"),
Token(type="SEMICOLON"),
]
assert lexer(source) == tokens_esperados
¿Cómo se implementan los nodos de AST?
Una vez que el lexer ha generado los tokens, el parser lo traduce en un Abstract Syntax Tree (AST), una estructura que describe el programa en términos de sus operaciones y datos. Para ampliar el parser y aceptar strings:
- Crear un nuevo nodo de AST llamado
StringLiteralque extiendeExpression. - Implementar un método
parseStringLiteralen el parser, ligando el nuevo tipo de token con esta función. - Definir cómo debe verse el string al ser representado, usualmente usando el valor del literal o el token del nodo:
class StringLiteral(Expression):
def __init__(self, token, value):
self.token = token
self.value = value
def __str__(self):
return self.value
¿Cómo se evalúan los strings en el intérprete?
Finalmente, una vez modificados el lexer y el parser, debemos actualizar el evaluador del intérprete para manejar adecuadamente los strings:
- Crear un nuevo objeto
String. - Asegurar que la función principal del evaluador reconozca cuándo debe construir un objeto de tipo
Stringa partir de un nodoStringLiteral. - Implementar las funciones de
typeeinspectpara el nuevo tipo, como se muestra:
class String(Object):
def __init__(self, value):
self.value = value
def type(self):
return "STRING"
def inspect(self):
return self.value
Con estos pasos, el intérprete no solo puede procesar strings, sino que queda listo para futuras expansiones, como la implementación de operaciones sobre las cadenas y revisión de la semántica de las mismas en procedimientos y funciones más avanzadas. La importancia de construir sobre una base robusta se evidencia cuando se trata de mejorar la funcionalidad de nuestro lenguaje a medida que crece en complejidad y potencia. Rica en detalles y organizada eficientemente, esta aproximación es la clave para construir un intérprete que pueda evolucionar sin dificultades.