No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Claude AI

Curso de Claude AI

Aníbal Rojas

Aníbal Rojas

Claude Multimodal vs. ChatGPT Multimodal

7/13
Recursos

¿Cómo interactúan Cloud y ChatGPT con el usuario?

En el mundo de la inteligencia artificial, tanto Cloud como ChatGPT ofrecen formas únicas de interactuar con los usuarios. Estos modelos, que son fundamentalmente estadísticos, ofrecen respuestas que pueden variar en cada consulta, incluso si las preguntas se parecen mucho. La retroalimentación es clave para mejorar estos modelos; puedes señalar si una respuesta fue útil o no, ayudando a refinar los resultados futuros.

¿Qué diferencias existen en multimodalidad?

Ambos sistemas son multimodales, lo que significa que pueden manejar más de un tipo de dato para interactuar, como texto, imágenes o audio. Sin embargo, hay diferencias significativas:

  • ChatGPT te permite dictar directamente en su aplicación de escritorio, un gran avance en la comodidad al interactuar. En cambio, Cloud aún no ha implementado esta característica en el escritorio, aunque sí está disponible en dispositivos móviles para dictado, pero no para conversación directa.

¿Pueden generar imágenes y código?

ChatGPT destaca en su capacidad para generar imágenes, aunque se mantiene con un modelo más antiguo comparado con las nuevas tecnologías de generación de imágenes. Por otro lado, Cloud se diferencia al generar código que puede crear representaciones visuales simples. Esta es una solución ingeniosa cuando la generación directa de imágenes no es posible.

  • Generación de imágenes:

  • ChatGPT puede generar imágenes, aunque sean básicas y con un toque estereotipado.

  • Cloud, al no poder generar imágenes, crea código que permite construir una imagen sencilla utilizando formas geométricas.

  • Generación de código:

  • Ambos modelos tienen capacidades para generar código, una funcionalidad que se discutirá en profundidad más adelante.

¿Cómo manejan la búsqueda de información?

En términos de búsqueda de información actualizada, ChatGPT tiene una ventaja clara. Gracias a su conexión con un buscador en Internet, puede proporcionar conocimiento actualizado y referencias a fuentes. En cambio, Cloud aún no tiene esta capacidad de búsqueda en línea, lo que limita su actualización de datos en tiempo real. En vez de proporcionar resultados de búsqueda, sugiere herramientas como Google Maps o directorios locales para encontrar información.

¿Cómo manejan la anexión y extracción de archivos?

La capacidad de manejar archivos adjuntos es otro punto donde se diferencia Cloud de ChatGPT:

  • Cloud:

  • Destaca en la extracción de información de archivos PDFs que contienen imágenes integradas, algo que ChatGPT no puede hacer eficientemente. Si un PDF incluye imágenes o gráficos, Cloud puede interpretar y extraer información de esas imágenes.

  • ChatGPT:

  • Tiene mejores capacidades para manejar distintos tipos de archivos en general, aunque presenta limitaciones con PDFs complejos que contienen imágenes.

¿Qué son las ventanas de contexto?

Las ventanas de contexto son esenciales para entender cómo los modelos procesan conversaciones:

  • Ventana de contexto de Cloud:

  • Es más amplia, con 200,000 tokens, permitiendo una memoria de conversación más extensa y detallada.

  • Ventana de contexto de ChatGPT:

  • Es de 128,000 tokens, lo que ofrece menos memoria para mantener información coherente a lo largo de una conversación.

Los tokens son fragmentos de datos que los modelos utilizan para procesar y entender fragmentos de texto.

¿Qué enfoque ético siguen los desarrolladores?

Un aspecto crucial es el enfoque ético:

  • Anthropic (Cloud):

  • Ha fomentado un uso ético y responsable de la inteligencia artificial, creando consciencia sobre sus limitaciones y sesgos.

  • OpenAI (ChatGPT):

  • Ha sido objeto de críticas debido a cuestiones de transparencia en los datos de entrenamiento, aunque continúa siendo un líder en avances tecnológicos.

Explorar tanto Cloud como ChatGPT puede ofrecer una perspectiva clara sobre sus capacidades y limitaciones. La elección entre estos modelos dependerá de tus necesidades específicas. ¡Continúa explorando el fascinante mundo de la inteligencia artificial!

Aportes 16

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Token es un termino q se usa en 3 areas de la tecnologia; en PLN - procesamiento de lenguaje natural (el tema de los LLMs), en seguridad informatica y en criptos, con significados distintos. En PLN, ser refiere al "la unidad basica de procesamiento". El proceso de tokenizacion varia de modelo a modelo, algunos equiparan un token a 1 palabra, pero los modelos principales como chatgpt y claude consideran tokens a las particulas de palabras, espacios, signos de puntuacion. Por ejemplo, gato, correr o mesa, son cada uno 1 token, pero "desafortunadamente" pueden ser 4 tokens "des-afortuna-da-mente" que corresponden a prefijos, raiz y dos sufijos, este es un tema de linguistica.
Al menos, nos informa que no puede generar imagene, pero hace una con formato SVG - El internet es mejor cuando hay un gatito 👌😎 ![](https://static.platzi.com/media/user_upload/image-7eb87233-806f-4bd0-8196-fbfb8f70b88e.jpg)
me encanta como Aníbal disfruta el proceso de generar el gato.
Hora Aníbal y compañeros. Tengo una pregunta, al generar imágenes desde ChatGpt, ¿esto supondría un costo adicional a mi pago mensual?
@anibal , creo que claude atendió tu prompt exactamente como le pediste, te generó un SVG, un grafico vectorial no tiene otra forma de " Explonerse " , min : 2:10, sigo mirando.
Con el plan gratuito Calude Sonnet 3.5 , dibujando un lobo: ![](https://static.platzi.com/media/user_upload/image-a577b573-a48e-40c1-9771-88e3823b4a6a.jpg)
Glosario básico: * La **ventana de contexto** se refiere a la capacidad que tiene un modelo de inteligencia artificial para recordar información a lo largo de una conversación. En el caso de Claude, su ventana de contexto es de 200,000 tokens, lo que le permite mantener un hilo de conversación más largo y recordar más detalles que ChatGPT, que tiene una ventana de 128,000 tokens. Esto es importante para asegurar que el modelo pueda responder de manera coherente y relevante durante interacciones prolongadas. * Un **token** es una unidad básica de datos que se utiliza en procesamiento de lenguaje natural y en modelos de inteligencia artificial. Representa partes de un texto, que pueden ser palabras completas, fragmentos de palabras o incluso caracteres. Estos modelos, como Claude y ChatGPT, manipulan tokens para entender y generar texto. En términos de contexto, un token facilita el manejo de información dentro de la "ventana de contexto" del modelo, que determina cuánta información puede retener y procesar simultáneamente. * La **multimodalidad** se refiere a la capacidad de un modelo de inteligencia artificial para procesar y generar información a partir de múltiples tipos de datos, como texto, imágenes y audio. En el contexto de Claude AI y ChatGPT, esto implica que ambos modelos pueden interactuar con diferentes formatos de contenido, aunque sus capacidades pueden variar. Por ejemplo, ChatGPT puede generar imágenes, mientras que Claude se destaca en la extracción de información de documentos PDF que contienen imágenes. La multimodalidad amplía las posibilidades de interacción y análisis en proyectos que integran diferentes medios. Saludos, Maria CRM
![](https://static.platzi.com/media/user_upload/image-250a4fad-e8e1-4897-8616-871b488b18f2.jpg)
![](https://static.platzi.com/media/user_upload/image-4bfc5f49-27c2-41d0-8927-441a1b803f58.jpg)
Con el plan gratuito, Claude 3.5 Haiku, no puede generar imágenes.![](https://static.platzi.com/media/user_upload/2025-02-06_114222-1a9b2bc6-2f67-48ca-834d-11103e6ae232.jpg) ChatGPT por su parte genera un buen resultado. ![](https://static.platzi.com/media/user_upload/2025-02-06_114304-4331cc2f-ea62-41ec-9152-66858de4a03c.jpg) Y Claude 3.5 Sonnet, hace un trabajo muy particular con la generación de código para cumplir con nuestra petición. ![](https://static.platzi.com/media/user_upload/2025-02-06_142119-515e4c94-ed83-4993-8106-f614c3c155f1.jpg)
Claude No genera imágenes, pero crea un programa que genera una imagen , en el panel de los artefactos podemos ver el código
Al momento, quiere decir que Claudé no tiene implementado un webscraping como lo tiene ChatGPT. Dependerá entonces como lo usemos y saber con cual verdad te quedas al mostar el resultado de cada uno.
Hasta ahora me parece que va "ganando" Chat gpt, salvo por la ventana de contexto, y la manera en la que trabaja con los artifacts, asi como la capacidad de entender las imagenes en el PDF, si tengo que elegir uno me seguiría quedando con ChatGPT, peero está el tema de la privacidad.
![](https://static.platzi.com/media/user_upload/image-30bd4a05-ac99-4291-8c5a-20cb4b1bf73f.jpg)
Me esta gustando mucho Claude, hice una prueba para crear el codigo de una landing page y con el mismo prompt la de Claude quedo mucho mejor y mas completa
**Prompt** crea una imagen de una rosa dentro de una jarra transparente con peces de color anaranjado adentro de ella, manos haciendo arreglo floral con fondo al aire libre en un dia sosloeado, los colores predominante son los pasteles. diseña con empleando una composicion interesante **Resultados** Ambos LLM compredieron su trabajo y lo entregaron segun sus capacidades, a pesar de que exite errores ortograficos en la instruccion. En la generacion de imagenes, se observa que ChatGPT logro un trabajo elaborado y detallado cumpliendo todas las indicaciones, que me ha soprendido y mejor de lo que me imaginaba. En cuanto a Claude, su cumplio a su manera, entregando una imagen mas monotona y aburrida, pero hay algo interesante que hizo, agrego una pequeña animacion en los peces. **Imagenes** ChatGPT ![](https://static.platzi.com/media/user_upload/image-4635a86d-15fd-44b3-8050-68278e0b3e51.jpg)les dejo la imagen entera tambien porque personamente me gusta mucho ![](https://static.platzi.com/media/user_upload/image-f92eba21-1837-48cf-adf8-00fb95d662d8.jpg) Claude ![](https://static.platzi.com/media/user_upload/image-842766f6-542b-4b7c-8d35-cf2191e34538.jpg)simulo ser imagen, pero en realidad soy codigo 😁 ![](https://static.platzi.com/media/user_upload/image-9df3d94e-9360-4907-9ace-ab0ed882b0ec.jpg)