Clase 13 · Espacios n-dimensionales y redes neuronales
LLMs desde cero (sin humo)
Idea central
Para usar bien la IA (o construirla), tenés que entender qué pasa por debajo.
Los LLMs no “piensan”: calculan en espacios matemáticos de muchas dimensiones.
1. Qué es (de verdad) un espacio n-dimensional
Un espacio n-dimensional es una forma de representar información como números.
- Cada dimensión = una característica.
- Un dato = un vector.
- Un texto no es texto → es un vector enorme.
Ejemplo mental:
- En 2D: (x, y)
- En LLMs: (x₁, x₂, x₃, … xₙ) con miles de dimensiones.
👉 Palabras con significado parecido quedan cerca en ese espacio.
Eso explica por qué el modelo “entiende” relaciones.
2. Embeddings: cómo el lenguaje entra a la matemática
El lenguaje se convierte en números mediante embeddings.
- Cada palabra/token → vector
- Vectores cercanos = significados relacionados
Ejemplo:
- “mamá” y “papá” → cerca
- “mamá” y “tornillo” → lejos
👉 El modelo no sabe español.
Sabe distancias entre vectores.
3. El perceptrón: la neurona artificial
Unidad básica de una red neuronal:
- Entradas: x₁, x₂, … xₙ
- Pesos: w₁, w₂, … wₙ
- Suma ponderada
- Función de activación
- Salida
Intuición:
una neurona decide cuánto importa cada entrada
Los pesos guardan el “conocimiento”.
4. Redes neuronales: capas, no magia
Una red neuronal es:
- muchas neuronas
- organizadas en capas
- operando con matrices
Cada capa aprende patrones más complejos que la anterior.
👉 No hay conciencia.
Hay álgebra lineal a escala.
5. Cómo aprenden: error y gradiente
El aprendizaje funciona así:
- El modelo predice
- Compara con el valor real
- Calcula el error (función de pérdida)
- Ajusta pesos para reducir ese error
Herramienta clave:
- Descenso por gradiente
- Con derivadas
- En espacios de alta dimensión
El objetivo: bajar la “montaña del error”.
6. Stochastic Gradient Descent (SGD)
Para no calcular todo junto:
- Ajustes pequeños
- Muchos pasos
- Datos en batches
👉 Más eficiente, escalable y estable.
7. Atención: el salto clave de los LLMs
Antes:
- RNN / LSTM → poco contexto
Ahora:
La atención responde:
“¿qué partes del texto importan para esta palabra?”
Componentes:
- Query: qué busco
- Key: dónde mirar
- Value: qué usar
Softmax normaliza las probabilidades.
👉 Esto permite manejar contextos largos.
8. Qué hace realmente un LLM
Un LLM:
- recibe tokens
- los convierte en vectores
- calcula relaciones
- estima probabilidades
- predice la siguiente palabra más probable
Nada más. Nada menos.
Por eso:
- puede sonar seguro
- y estar equivocado
Es estadística, no verdad.
9. Por qué esto importa en tu trabajo
Porque entendés:
- por qué se equivoca
- cuándo confiar
- cuándo verificar
- cómo escribir mejor prompts
- por qué “alucina”
Y si querés ir más allá:
- sabés qué estudiar (álgebra, cálculo, probabilidad)
Cierre (idea que te llevás)
Los LLMs no son magia.
Son matemática aplicada al lenguaje.
Si entendés eso:
- dejás de sobre-idealizarlos
- dejás de frustrarte
- los usás con criterio
Eso es ventaja real.