Soft limit y hard limit en OpenAI

Curso de Desarrollo de Chatbots con OpenAI

Contenido del curso

OpenAI API

Fine-tuning de modelos de OpenAI

Integración de modelo a aplicación de chat

Conclusión

24
Proyectos de Fine Tuning y Procesamiento de Lenguaje Natural
02:58 min

Tomar examen

Soft limit y hard limit en OpenAI

Resumen

Cuando empiezas a integrar modelos de OpenAI en tus proyectos, hay un conjunto de buenas prácticas que marcan la diferencia entre un consumo eficiente y una factura inesperada. Aquí te explico cómo controlar el uso, configurar límites de facturación y administrar usuarios desde el panel de OpenAI, pensado para desarrolladores que ya consumen la API y quieren optimizar su flujo.

¿Cómo optimizar el uso de los modelos de OpenAI?

El primer paso es escribir solicitudes claras y con el mayor contexto posible. Cuanto mejor formules tu prompt, mejor responderá el modelo y menos iteraciones gastarás.

Después viene el control de longitud. Aquí entra el concepto de token, la unidad mínima que OpenAI usa para medir texto y cobrarte. Saber cuántos tokens consume un texto te permite anticipar costos y ajustar la respuesta.

También conviene experimentar con hiperparámetros como la temperature, que regula qué tan creativa o determinista es la salida del modelo. Probar distintos valores te ayuda a encontrar el equilibrio entre precisión y variedad.

¿Qué es un token en OpenAI? Es la unidad mínima en la que el modelo divide el texto para procesarlo y facturarlo. Una palabra puede equivaler a uno o varios tokens dependiendo del idioma y la complejidad.

¿Dónde reviso el consumo y la facturación de mi cuenta?

Desde platform.openai.com, en la sección Manage Account, tienes una vista completa de cómo tu organización está usando los modelos [1:24]. Ahí encuentras el nombre de la organización y el ID que la identifica.

Dentro de Usage puedes filtrar por fechas y ver el monto en dólares consumido cada día. Por ejemplo, en una cuenta puedes notar un consumo de 9.21 dólares el 14 de mayo y 28 dólares el 24 de mayo, con un acumulado de 43.17 dólares dentro del límite establecido [2:05]. Esa vista también permite desglosar el gasto por miembros del equipo.

¿Qué son los rate limits y por qué importan?

En la sección Rate limits aparece el tope máximo de tokens por minuto y requests por minuto que cada modelo te permite [2:54]. Conocer estos límites es clave si tu aplicación maneja tráfico alto, porque saturarlos genera errores en producción.

¿Cuál es la diferencia entre soft limit y hard limit?

Dentro de Billing > Usage limits, OpenAI asigna por defecto un tope de 120 dólares por cuenta [3:13]. A partir de ahí puedes configurar dos límites propios:

Soft limit: cuando lo superas, OpenAI te envía un correo de aviso, pero puedes seguir consumiendo los modelos.
Hard limit: al alcanzarlo, los requests se bloquean automáticamente. En el ejemplo del panel, está fijado en 100 dólares.
Límite por defecto de OpenAI: el tope global de la cuenta, que no puedes superar sin solicitar aumento.

¿Qué pasa si llego al hard limit? Tu aplicación deja de recibir respuestas de la API hasta que reinicies el ciclo de facturación o aumentes el límite. Por eso conviene fijarlo con margen.

Si necesitas más capacidad, en Request increase llenas un formulario con el ID de tu organización y una descripción del caso de uso para acceder a un rango mayor [3:55].

¿Cómo gestionas seguridad y usuarios en OpenAI?

Usar la API responsablemente implica tres frentes: manejo de errores y excepciones, ética y consideraciones legales y privacidad de los datos. Si vas a personalizar modelos con tu propia información, asegúrate de obtenerla de forma ética y con consentimiento.

El control de usuarios se gestiona en la sección Members del panel [4:38]. Hay dos roles disponibles:

Owner o propietario: configura facturación, define límites y administra a los demás miembros.
Reader: solo puede consumir los modelos dentro del espacio que el owner le habilite.

Delimitar bien estos roles evita que cualquier persona del equipo modifique configuraciones críticas o dispare el gasto sin control.

¿Dónde resuelves dudas técnicas adicionales?

OpenAI mantiene un foro abierto donde la comunidad comparte soluciones, casos de uso y respuestas a problemas comunes con la API. Es un buen complemento cuando la documentación oficial se queda corta.

Si ya configuraste tus límites o tienes alguna duda sobre cómo afinar el consumo, déjala en los comentarios.

Mateo Montoya Henao

Estudiante

Aquí tienes una lista de buenas prácticas al usar modelos de OpenAI:

1. Cumple con las políticas de uso

Respetar las leyes aplicables: No comprometas la privacidad de los demás, no realices actividades reguladas sin cumplir con las regulaciones pertinentes y no promuevas o participes en actividades ilegales.
No causar daño: No uses los servicios de OpenAI para dañarte a ti mismo o a otros. No repurpuse o distribuya la salida de nuestros servicios para causar daño a otros.

2. Usa los parámetros adecuadamente

Temperature: Controla la creatividad de las respuestas. Valores bajos producen respuestas más deterministas, mientras que valores altos producen respuestas más creativas.
Top_p: Limita la selección de tokens a los más probables, afectando la coherencia y la diversidad de las respuestas.
n: Especifica cuántas variantes de respuesta el API debe generar para una sola entrada.

3. Escribe prompts claros y efectivos

Simplicidad y claridad: Escribe prompts breves y claros. Evita prompts engorrosos y precisos.
Especifica los detalles: Sea específico sobre el contexto, el resultado, la longitud, el formato y el estilo deseado.
Usa ejemplos: Proporciona ejemplos específicos de la salida deseada para ayudar al modelo a entender mejor tus requisitos.

4. Usa delimitadores para la claridad

Delimitadores: Usa delimitadores como marcado de texto, etiquetas XML y títulos de secciones para indicar claramente diferentes partes de la entrada, ayudando al modelo a interpretar adecuadamente diferentes secciones.

5. Intenta el enfoque sin disparos primero, luego el enfoque con pocos disparos si es necesario

Enfoque sin disparos: Los modelos de razonamiento a menudo no necesitan ejemplos de enfoque con pocos disparos para producir buenos resultados, así que intenta escribir prompts sin ejemplos primero.
Enfoque con pocos disparos: Si tienes requisitos más complejos para la salida deseada, puede ayudar incluir un par de ejemplos de entradas y salidas deseadas en tu prompt. Asegúrate de que los ejemplos coincidan muy de cerca con las instrucciones de tu prompt, ya que las discrepancias entre los dos pueden producir resultados pobres.

6. Proporciona directivas específicas

Directivas específicas: Si hay maneras en las que deseas restringir la respuesta del modelo de manera explícita (como "propone una solución con un presupuesto inferior a $500"), incluye esas restricciones explícitamente en el prompt.

7. Sé muy específico sobre tu objetivo final

Objetivo final específico: En tus instrucciones, intenta proporcionar parámetros muy específicos para una respuesta exitosa y anima al modelo a continuar razonando e iterando hasta que coincida con tus criterios de éxito.

8. Usa el formato de marcado Markdown

Formato de marcado: A partir de o1-2024-12-17, los modelos de razonamiento en la API evitarán generar respuestas con formato de marcado Markdown. Para indicar al modelo cuando desees formato de marcado en la respuesta, incluye la cadena "Formatting re-enabled" en la primera línea de tu mensaje de desarrollador.

9. Evita prompts de cadena de pensamiento

Cadena de pensamiento: Los modelos realizan el razonamiento internamente, por lo que instarlos a "pensar paso a paso" o "explicar tu razonamiento" es innecesario y puede incluso perjudicar el rendimiento.

10. Usa el enfoque sin disparos primero, luego el enfoque con pocos disparos si es necesario

Enfoque sin disparos: Los modelos de razonamiento a menudo no necesitan ejemplos de enfoque con pocos disparos para producir buenos resultados, así que intenta escribir prompts sin ejemplos primero.
Enfoque con pocos disparos: Si tienes requisitos más complejos para la salida deseada, puede ayudar incluir un par de ejemplos de entradas y salidas deseadas en tu prompt. Asegúrate de que los ejemplos coincidan muy de cerca con las instrucciones de tu prompt, ya que las discrepancias entre los dos pueden producir resultados pobres.

11. Reduce las descripciones "flacas" e imprecisas

Descripciones precisas: Evita descripciones vagues e imprecisas. Sea específico y descriptivo.

12. En lugar de solo decir lo que no hacer, di lo que hacer en su lugar

Instrucciones claras: En lugar de solo decir lo que no hacer, di lo que hacer en su lugar. Esto proporciona una orientación más clara y efectiva.

13. Usa palabras clave para orientar el modelo hacia un patrón específico

Palabras clave: Usa palabras clave específicas para orientar el modelo hacia un patrón específico. Por ejemplo, agregar "import" al modelo le da una pista de que debe comenzar a escribir en Python.

14. Usa la función "Generar Cualquier cosa"

Generar Cualquier cosa: Los desarrolladores pueden usar la función "Generar Cualquier cosa" para describir una tarea o una salida natural en lenguaje y recibir una plantilla personalizada.

15. Usa el modelo más reciente

Modelo más reciente: Para obtener los mejores resultados, se recomienda generalmente usar el modelo más reciente y capaz. Los modelos más recientes tienden a ser más fáciles de trabajar con.

16. Respetar la privacidad y los derechos de los creadores

Privacidad y derechos: No comparta o distribuya la salida de nuestros servicios de manera que pueda comprometer la privacidad de los demás o los derechos de los creadores.

17. No responda con contenido NSFW

Contenido NSFW: No genere o responda con contenido no apto para todos (NSFW) a menos que esté en un contexto apropiado para la edad.

18. Usa el sistema de moderación de OpenAI

Moderación: Utiliza el sistema de moderación de OpenAI para detectar y evitar contenido inapropiado o dañino.

19. No uses el modelo para actividades no permitidas

Actividades no permitidas: No uses el modelo para actividades como la generación de contenido ilegal, el engaño o la promoción de actividades peligrosas.

20. Mantén un enfoque ético y responsable

Enfoque ético: Asegúrate de que el uso del modelo sea ético y responsable, evitando cualquier uso que pueda causar daño o abuso.

Siguiendo estas prácticas, puedes aprovechar al máximo los modelos de OpenAI mientras mantienes un enfoque ético y seguro.

Rogger Erikson Cruz Zapata

Juan R. Vergara M.

Lilián Gómez

Hugo Montoya Diaz

Pepe Sosa

Nelson Andrés Loyola Salas

miguel laurente

Jose Miguel Lopez

Percy Soria Del Castillo

Tabares Hernandez Jose Luis

Luis Rogelio Reyes Hernandez

Patricio Sánchez Fernández

Abraham Crisanto Parada Calderon

Erasmo Herrera

Sebastián Vergara Villegas

Alex Gary Silvestre Fuentes

Ricardo Mazuera

Sebastian Gaviria

Jorge onam Barcelo alfaro

John Fredy Ramirez Bedoya

Wilson Barrera

Jorge Ivan Meza

Carlos

Arístides Pérez Hernández

Soft limit y hard limit en OpenAI

OpenAI API

Análisis de sentimiento con la API de OpenAI

Uso de la Documentación de OpenAI para Fine Tuning y Text Completion

Roles en Chat Completions con GPT-3.5

Temperatura y top P en la API de OpenAI

Juego de adivinanza de animales con OpenAI en Python