Idiogram y el arte de extender imágenes con IA

Contenido del curso

El presente y futuro de la inteligencia artificial

Resumen

La inteligencia artificial generativa ya no es un concepto futurista: está en tu celular, en tus aplicaciones de diseño y al alcance de cualquier persona que quiera crear o editar imágenes sin ser artista gráfico. Entender cómo funcionan estas herramientas, qué las diferencia de modelos de texto como ChatGPT y cuáles son sus limitaciones te permite aprovecharlas de forma práctica y responsable.

¿Cómo funciona la IA generativa en imágenes y en qué se diferencia de ChatGPT?

Uno de los puntos más relevantes es la distinción entre tipos de modelos generativos. Los grandes modelos del lenguaje (large language models) como ChatGPT, Claude y Llama operan fundamentalmente con texto: sus entradas son texto y sus salidas son texto, basándose en patrones del lenguaje humano [1:13]. En cambio, los modelos de generación de imágenes reciben una imagen o un texto como entrada y producen una imagen como salida. La tecnología subyacente es diferente.

Lo que ambos tipos de modelos comparten es un elemento de azar [1:42]. Ese componente aleatorio es precisamente lo que permite generar resultados nuevos y distintos cada vez que se ejecuta una solicitud. Sin embargo, estos modelos no son creativos: combinan elementos con los que fueron entrenados, pero la creatividad sigue siendo una capacidad humana.

Otro concepto técnico importante es el ruido [5:00]. Las imágenes generadas surgen desde un estado inicial de ruido aleatorio que el modelo va refinando progresivamente hasta producir la imagen final, pasando por lo que se podría describir como borradores sucesivos.

¿Qué herramientas existen para generar y editar imágenes con IA?

El ecosistema de herramientas es amplio y está creciendo rápidamente:

Editores integrados en el celular: permiten borrar personas u objetos de una foto seleccionándolos y pidiéndole a la IA que regenere el fondo [0:18].
Software tradicional con IA integrada: marcas como Photoshop de Adobe y Canva están incorporando funciones de inteligencia artificial en sus productos existentes [3:28].
Herramientas nativas de IA: como Idiogram, que destaca por su precisión en el manejo de textos dentro de las imágenes, algo que suele ser problemático para estos modelos [3:52].
Otros generadores: Stable Diffusion fue el precursor de esta categoría, Flux ofrece resultados destacados, y hasta ChatGPT puede generar imágenes aunque con menor calidad que herramientas especializadas [10:47].
Generación de video: herramientas como HeyGen permiten crear avatares y videos a partir de imágenes [11:08].

¿Qué es el canvas y cómo se extiende una imagen?

Una funcionalidad cada vez más popular es el canvas o lienzo [4:10]. En Idiogram, por ejemplo, puedes tomar una imagen generada y extenderla más allá de sus bordes originales. El proceso consiste en seleccionar un área de referencia, describir con texto lo que quieres que aparezca en la zona nueva y dejar que el modelo complete la imagen.

En la demostración se generó una botella de jugo verde con una etiqueta personalizada, se seleccionó como semilla y se le pidió que extendiera la escena mostrando a una mujer ejecutiva trabajando en su escritorio [6:17]. El resultado fusionó ambos elementos de forma coherente, aunque con pequeñas imperfecciones en el texto y la composición.

¿Por qué las palabras que usas en el prompt importan tanto?

Cada palabra cuenta al describir lo que quieres generar. Puedes definir el estilo (realista, artístico, automático), la proporción de la imagen y detalles específicos como colores o contexto [4:55]. El modelo no adivina tus intenciones: interpreta literalmente tu descripción y la complementa con asociaciones aprendidas durante su entrenamiento.

¿Cuáles son los riesgos y responsabilidades al usar IA para imágenes?

El sesgo en los datos de entrenamiento es un problema real [8:40]. Estos modelos fueron expuestos a conjuntos masivos de imágenes de Internet, seleccionados por humanos que pudieron introducir sesgos involuntarios. Un caso mencionado ilustra esto perfectamente: una conferencista descubrió que al extender su foto con IA, el modelo le añadió un escote que no existía en la imagen original [7:52]. El modelo simplemente completó con los patrones más frecuentes en sus datos.

Sobre la propiedad de las imágenes generadas, existe un debate activo [9:27]. No todo lo que está en Internet es dominio público, y hay demandas de artistas contra empresas que usaron sus obras para entrenar modelos. La recomendación práctica es revisar siempre los términos de uso de cada herramienta para entender quién retiene los derechos sobre las imágenes generadas.

El principio fundamental es mantenerse en el loop: no generar imágenes sin revisarlas, verificar que el resultado sea coherente con el contexto y asumir la responsabilidad sobre lo que se publica. La IA generativa es una herramienta poderosa para explorar ideas visuales, prototipar conceptos de campañas publicitarias o comunicar visualmente lo que tienes en mente, pero siempre requiere supervisión humana.

¿Ya probaste alguna de estas herramientas? Comparte tu experiencia y qué resultados has obtenido.

Juan Carlos Quishpe

student

Uso de Inteligencia Artificial para Editar Fotos

- Se emplea IA en teléfonos móviles para editar fotos, eliminando elementos o personas no deseadas.

Inteligencia Artificial Generativa

- La herramienta utilizada es una IA generativa, similar a ChatGPT, pero orientada a imágenes.

- Estos modelos generativos tienen un componente de azar, lo que permite generar resultados novedosos y variados.

Herramientas Disponibles para la Edición de Imágenes

- Existen numerosas herramientas para la edición y generación de imágenes con IA, como Adobe Photoshop y Canva, que están incorporando funcionalidades basadas en IA.

- La herramienta Ideogram permite crear y extender imágenes con precisión, añadiendo contexto adicional a partir de una base inicial.

Sesgos y Limitaciones en la Generación de Imágenes con IA

- Los modelos de IA pueden verse influenciados por sesgos debido al conjunto de datos con el que se entrenaron, lo cual puede llevar a resultados inapropiados o inesperados.

Propiedad de las Imágenes Generadas por IA

- Existen preocupaciones sobre la propiedad de las imágenes generadas por IA, ya que muchas veces se entrenan con datos tomados de Internet sin ser necesariamente dominio público.

- Se destaca la importancia de un uso responsable y la revisión de los términos de uso para evitar problemas legales con los derechos de autor.

Exploración Creativa con Herramientas de IA

- Herramientas de generación de imágenes y video como Hey Gen permiten la creación de avatares y la exploración de nuevas formas de creatividad.

- La exploración con estas herramientas ayuda a superar limitaciones personales, como la falta de habilidad para dibujar, y abre nuevas posibilidades artísticas para cualquier persona.

ALFONSO MARTIN BOZA TUCKLER

student

excelente el formato del curso muy educativo.

William Ruiz

student

gracias por tu aporte

Enrique Alexis Lopez Araujo

Diego Ortiz

Claudia Patricia Granada Ramírez

Gabriel Obregón

Ariel Hernán Contini

Eloy Chávez Dev

Laura Juliana Mantilla Rincón

Platzi

Nicolás Exequiel Vittar

Jeffer Steven Nuñez Aragon

•

Guillermo Marmanillo

Javier Ramos

Ana Luisa Bucarito de González

Karen Itzel Pérez Lugo

Vanessa Núñez

Laura Pino

Alejandra Monges

Andrés David Muñoz Isaza

Albert Jesus Blanco Vera

Moisés Arocha

Sheyla Fonseca

Pedrito Richard Alvarado Garcia

Lizette Rosalía Dazza Hernández

El presente y futuro de la inteligencia artificial

Qué puede hacer ChatGPT con tus finanzas

Plan de lanzamiento de producto con ChatGPT

IA que ya usas sin saberlo

Sembly y ChatGPT como asistentes de reunión

Crea un plan de capacitación con Claude

Asistente de reuniones con Sembly y ChatGPT

Qué son los modelos multimodales de IA

Analiza informes financieros con ChatGPT

Cómo los abogados usan ChatGPT con documentos

Analiza informes de 45 páginas con ChatGPT

Idiogram y el arte de extender imágenes con IA

Napkin AI: diagramas desde texto con IA

Cómo la IA clona voces para estafarte

Videos promocionales con avatares en HeyGen

Cómo integrar IA generativa en tu trabajo hoy

Resumen