Implementación de Operadores de Dos Caracteres en Lexer
Clase 10 de 58 • Curso de Creación de Lenguajes de Programación: Intérpretes
Contenido del curso
- 3

Análisis Léxico: Construcción de un Léxer para Intérpretes
05:36 - 4

Definición de Tokens en Lenguaje de Programación Platzi
11:53 - 5

Desarrollo de un Lexer con Test-Driven Development
15:43 - 6

Pruebas de Operadores, Delimitadores y Fin de Archivo en Lexer Python
10:01 - 7

Lexer: Identificación de Keywords y Tokens Complejos
18:57 - 8

Reconocimiento de Funciones en Lexer de Lenguaje de Programación
07:46 - 9

Implementación de Operadores y Condicionales en Lexer de Platzi
12:38 - 10

Implementación de Operadores de Dos Caracteres en Lexer
12:08 - 11

Creación de un REPL en Python para Lenguaje de Programación
12:35
- 12

Construcción de un Parser para el Lenguaje Platzi
05:22 - 13

Definición de Nodos Abstractos para Árbol de Sintaxis (AST) en Python
09:14 - 14

Desarrollo de un AST en Python: Creación de la Clase Programa
12:49 - 15

Parseo de Let Statements en Lenguaje Platzi
20:21 - 16

Implementación de funciones advanced y expected tokens
08:26 - 17

Manejo de Errores en Parsers con Test Driven Development
11:06 - 18

Parseo de Return Statements en Lenguaje Platzi
12:42 - 19
Técnicas de Parsing: Top-Down y Bottom-Up
01:46 - 20

Pruebas de AST para Let y Return Statements en Parsers
12:06 - 21

Pratt Parsing: Implementación y Registro de Funciones en Python
11:47 - 22

Parseo de Identificadores en Lenguajes de Programación
13:29 - 23

Parseo de Expression Statements en Platzi Parser
16:34 - 24

Parseo de Enteros en Lenguaje Platzi
14:03 - 25

Implementación de Operadores Prefijo en Parsers
16:43 - 26

Operadores InFix en Expresiones: Implementación y Pruebas
10:40 - 27

Implementación de Operadores InFix en un Parser
20:20 - 28

Expresiones Booleanas en el Lenguaje de Programación Platzi
13:00 - 29

Evaluación de Precedencia y Testeo de Booleanos en Parsers
08:39 - 30

Evaluación de Expresiones Agrupadas en un Parser
10:16 - 31

Parseo de Condicionales en Lenguaje Platzi
13:50 - 32

Implementación de Condicionales en Parser de Lenguaje
12:05 - 33

Parsing de Funciones en Lenguaje Platzi: Creación de Nodos AST
15:51 - 34

Construcción de nodos de función en un parser AST
15:43 - 35

Llamadas a Funciones en Lenguajes de Programación
13:05 - 36

Implementación de llamadas a funciones en un parser con AST
12:21 - 37

Parseo de Expresiones en LET y RETURN Statements
07:58 - 38

Implementación de REPL para Árbol de Sintaxis Abstracta
08:59
- 39

Evaluación Semántica en Lenguajes de Programación
03:42 - 40

Estrategias de Evaluación en Lenguajes de Programación
09:18 - 41

Representación de Nodos AST y Objetos en Python
14:17 - 42

Evaluación de Expresiones en JavaScript y Python
19:39 - 43

Implementación del Patrón Singleton para Booleanos y Nulos
11:52 - 44

Evaluación de Prefijos en Lenguaje de Programación Platzi
14:41 - 45

Evaluación de Expresiones Infix en Lenguaje Platzi
18:07 - 46

Evaluación de Condicionales en Lenguaje de Programación Platzi
13:50 - 47

Evaluación y Uso del Return Statement en Programación
14:42 - 48

Manejo de Errores Semánticos en Lenguaje Platzi
21:05 - 49

Declaración y Gestión de Variables en Lenguajes de Programación
13:55 - 50

Manejo de Ambientes y Variables en Lenguajes de Programación
11:57 - 51

Declaración de Funciones en Lenguaje de Programación Platzi
12:26 - 52

Implementación de Llamadas a Funciones en PlatziLang
23:55
¿Cómo implementar operadores de dos caracteres en un Lexer?
La implementación de operadores de dos caracteres en un lexer es una tarea vital para lograr que un lenguaje de programación pueda interpretar correctamente estas combinaciones. Este artículo te guiará a través del proceso de implementación de operadores como == y !=, fundamentales en lenguajes como JavaScript o Python. No te preocupes; veremos paso a paso lo que necesitas para implementar estos operadores en tu lexer.
El lexer hasta ahora usa variables position y readPosition para manejar el flujo de caracteres. Estas variables permiten prever el carácter siguiente, proporcionando el contexto necesario para identificar operadores de dos caracteres.
¿Cómo se estructura el test para operadores de dos caracteres?
Crear un test unitario es el primer paso. Aquí configuramos un test llamado testToCharacterOperators. En este test, se definen las expectativas de cómo debería comportarse el lexer con entradas como 10 == 10; o 10 != 9;. Al final, esperamos que el lexer retorne una lista de tokens que incluya números, operadores y delimitadores como el punto y coma.
def testToCharacterOperators():
source = "10 == 10; 10 != 9;"
expected_tokens = [
TokenType.NUMBER, '10',
TokenType.EQUALS,
TokenType.NUMBER, '10',
TokenType.SEMICOLON,
TokenType.NUMBER, '10',
TokenType.NOT_EQUALS,
TokenType.NUMBER, '9',
TokenType.SEMICOLON
]
lexer = Lexer(source)
tokens = lexer.tokenize()
assert tokens == expected_tokens
¿Cómo se manejan los tokens de igualdad y desigualdad?
Para tratar con operadores de dos caracteres como == y !=, debes definir nuevos tipos de tokens llamados equals y not equals. Estos se añaden al archivo de tipos de tokens. Esto permitirá al lexer diferenciar entre una asignación simple = y una evaluación de igualdad ==.
def initializeTokenTypes():
TokenType.EQUALS = "=="
TokenType.NOT_EQUALS = "!="
¿Cómo se implementa la anticipación de caracteres?
La función pickCharacter() es fundamental. Permite al lexer 'asomarse' al siguiente carácter sin avanzar la posición actual, una capacidad clave para determinar si un = es seguido por otro =.
def pickCharacter():
if self.readPosition >= len(self.source):
return ''
return self.source[self.readPosition]
¿Cómo crear tokens de dos caracteres?
La función makeToCharacterToken() genera un token cuando se detectan dos caracteres consecutivos que forman un operador. Esta es llamada cuando una comparación == o != es detectada.
def makeToCharacterToken(tokenType):
prefix = self.currentCharacter
self.readCharacter() # Avanza al siguiente carácter
suffix = self.currentCharacter
return Token(tokenType, prefix + suffix)
¿Qué sigue después de la implementación del lexer?
¡Felicidades! Has completado una parte importante de tu lexer. Ahora es capaz de leer operadores de un solo y doble carácter, identificar palabras clave, delimitadores y más. Pero esto es solo el comienzo. La implementación de un REPL (Read-Eval-Print Loop) permitirá interactuar directamente con el sistema para evaluar expresiones en tiempo real.
Con esto concluimos la implementación de operadores de dos caracteres en un lexer. Sigue avanzando en tu viaje de aprendizaje, experimenta con tu lexer y considera cómo la programación en español puede hacer que los lenguajes de programación sean más accesibles. ¡Adelante, el mundo del desarrollo espera por ti!