Desarrollo de un Lexer con Test-Driven Development
Clase 5 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes
Contenido del curso
- 3

Análisis Léxico: Construcción de un Léxer para Intérpretes
05:36 - 4

Definición de Tokens en Lenguaje de Programación Platzi
11:53 - 5

Desarrollo de un Lexer con Test-Driven Development
15:43 - 6

Pruebas de Operadores, Delimitadores y Fin de Archivo en Lexer Python
10:01 - 7

Lexer: Identificación de Keywords y Tokens Complejos
18:57 - 8

Reconocimiento de Funciones en Lexer de Lenguaje de Programación
07:46 - 9

Implementación de Operadores y Condicionales en Lexer de Platzi
12:38 - 10

Implementación de Operadores de Dos Caracteres en Lexer
12:08 - 11

Creación de un REPL en Python para Lenguaje de Programación
12:35
- 12

Construcción de un Parser para el Lenguaje Platzi
05:22 - 13

Definición de Nodos Abstractos para Árbol de Sintaxis (AST) en Python
09:14 - 14

Desarrollo de un AST en Python: Creación de la Clase Programa
12:49 - 15

Parseo de Let Statements en Lenguaje Platzi
20:21 - 16

Implementación de funciones advanced y expected tokens
08:26 - 17

Manejo de Errores en Parsers con Test Driven Development
11:06 - 18

Parseo de Return Statements en Lenguaje Platzi
12:42 - 19
Técnicas de Parsing: Top-Down y Bottom-Up
01:46 - 20

Pruebas de AST para Let y Return Statements en Parsers
12:06 - 21

Pratt Parsing: Implementación y Registro de Funciones en Python
11:47 - 22

Parseo de Identificadores en Lenguajes de Programación
13:29 - 23

Parseo de Expression Statements en Platzi Parser
16:34 - 24

Parseo de Enteros en Lenguaje Platzi
14:03 - 25

Implementación de Operadores Prefijo en Parsers
16:43 - 26

Operadores InFix en Expresiones: Implementación y Pruebas
10:40 - 27

Implementación de Operadores InFix en un Parser
20:20 - 28

Expresiones Booleanas en el Lenguaje de Programación Platzi
13:00 - 29

Evaluación de Precedencia y Testeo de Booleanos en Parsers
08:39 - 30

Evaluación de Expresiones Agrupadas en un Parser
10:16 - 31

Parseo de Condicionales en Lenguaje Platzi
13:50 - 32

Implementación de Condicionales en Parser de Lenguaje
12:05 - 33

Parsing de Funciones en Lenguaje Platzi: Creación de Nodos AST
15:51 - 34

Construcción de nodos de función en un parser AST
15:43 - 35

Llamadas a Funciones en Lenguajes de Programación
13:05 - 36

Implementación de llamadas a funciones en un parser con AST
12:21 - 37

Parseo de Expresiones en LET y RETURN Statements
07:58 - 38

Implementación de REPL para Árbol de Sintaxis Abstracta
08:59
- 39

Evaluación Semántica en Lenguajes de Programación
03:42 - 40

Estrategias de Evaluación en Lenguajes de Programación
09:18 - 41

Representación de Nodos AST y Objetos en Python
14:17 - 42

Evaluación de Expresiones en JavaScript y Python
19:39 - 43

Implementación del Patrón Singleton para Booleanos y Nulos
11:52 - 44

Evaluación de Prefijos en Lenguaje de Programación Platzi
14:41 - 45

Evaluación de Expresiones Infix en Lenguaje Platzi
18:07 - 46

Evaluación de Condicionales en Lenguaje de Programación Platzi
13:50 - 47

Evaluación y Uso del Return Statement en Programación
14:42 - 48

Manejo de Errores Semánticos en Lenguaje Platzi
21:05 - 49

Declaración y Gestión de Variables en Lenguajes de Programación
13:55 - 50

Manejo de Ambientes y Variables en Lenguajes de Programación
11:57 - 51

Declaración de Funciones en Lenguaje de Programación Platzi
12:26 - 52

Implementación de Llamadas a Funciones en PlatziLang
23:55
¿Cómo iniciar la construcción de un lexer y los primeros tests?
Desarrollar un lexer efectivo es un arte que requiere paciencia y atención al detalle. Al iniciar este proceso, es fundamental adoptar el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD). Esto implica escribir las pruebas antes del código y es una práctica que ayudará a garantizar que tu código funcione como esperas. En esta sesión, vamos a enfocar nuestros primeros tests en tokens ilegales, operadores de un solo carácter y el token EOF (End of File) que nos señala el final del archivo. También, nos enfrentaremos al reto de los delimiters.
Los métodos clave que implementaremos en nuestro lexer incluyen:
next_token: nuestro principal punto de interacción con el lexer, que continuamente nos proporcionará el siguiente token._read_character: una función privada para leer cada carácter del texto fuente.
¿Cuál es el proceso para escribir nuestros tests?
Los tests actúan como una guía y nos ayudan a verificar continuamente que el código esté en el camino correcto. Aquí se describen los pasos esenciales para escribir tu primer test:
-
Configuración del entorno: Asegúrate de estar en un branch correcto para el desarrollo, como "building del lexer número 1". Corre
mypyynosepara verificar que no hay problemas en tu entorno. -
Estructura del proyecto: Crea un archivo
__init__.pydentro de tus carpetas para quemypyynosepuedan reconocer los paquetes. Organiza tu proyecto de manera que todas las pruebas residan en una carpetatest. -
Escritura del test: Abre un editor de texto para
Lexertesty comienza importandoTestCasedesdeunittest. Luego, crea la claseLexerTestque extiendeTestCase. Aquí es donde se definirá cada test. -
Definir el test para tokens ilegales: Por ejemplo, define caracteres ilegales como
!,¿, y@. Inicializa un lexer y usa una lista para almacenar los tokens devueltos tras llamar anext_token. -
Asserts y errores: Asegúrate de usar
assertEqualpara verificar que la lista de tokens devueltos coincide con la esperada. Los errores en este punto son valiosos, te guiarán sobre qué ha fallado y cómo solucionarlo.
¿Cómo implementamos las funciones clave del lexer?
Con los tests en su lugar, es momento de codificar las funciones necesarias. Aquí se desglosan los pasos para implementar los métodos de nuestro lexer:
-
Inicializar el lexer: Empieza creando una clase
Lexercon un constructor que recibe unsource. Define también una variable privada_sourcepara almacenar este valor. -
Implementar
next_tokeny_read_character:next_token: Este método regresará un token. Inicialmente, puede devolver un token ilegal con un carácter vacío hasta que se implemente la lógica adecuada._read_character: Esta función se encargará de avanzar en el texto fuente y deberá actualizar las posiciones de las variables internas.
class Lexer:
def __init__(self, source: str) -> None:
self._source = source
self._read_position = 0
self._position = 0
self._character = ''
self._read_character()
def next_token(self) -> Token:
token = Token(TokenType.ILLEGAL, self._character)
self._read_character()
return token
def _read_character(self) -> None:
if self._read_position >= len(self._source):
self._character = ''
else:
self._character = self._source[self._read_position]
self._position = self._read_position
self._read_position += 1
¿Cómo resolver errores y avanzar en el desarrollo?
El desarrollo guiado por pruebas es un ciclo de escribir fallos de tests, solucionarlos y mejorar continuamente. Aquí algunas recomendaciones al enfrentar errores:
- Leer errores atentamente: Estos mensajes a menudo te dicen exactamente dónde está el problema y cómo corregirlo.
- Resolver errores gradualmente: Correcciones pequeñas y frecuentes son preferibles a cambios drásticos que pueden introducir más errores.
- Considerar los errores como aliados: Permiten identificar partes del código que no funcionan como se esperaba y son esenciales para mejorar tu producto final.
Las pruebas y los errores son parte inseparable del proceso de desarrollo, y aprender a manejarlos te convertirá en un mejor desarrollador. ¡Con perseverancia, cada error es una oportunidad de aprendizaje que te acerca más a una solución robusta y optimizada!