ChatGPT cuenta con una nueva función para crear imágenes realistas

EmailFacebookTwitterLinkedinPinterest
26/04/2025 - 18:00
Chatgpt da lugar a imágenes realistas y de anime

Lectura fácil

La última actualización de ChatGPT trae una de las funciones más esperadas: la generación de imágenes realistas directamente desde el chat, sin necesidad de acudir a herramientas externas como DALL·E.

Esta capacidad forma parte del nuevo modelo GPT-4o, que no solo mejora el rendimiento general de la plataforma, sino que también introduce una experiencia visual mucho más completa e intuitiva.

GPT-4o: el modelo que convierte texto en imágenes realistas desde una conversación

Gracias a GPT-4o, es posible crear imágenes a partir de simples descripciones escritas, archivos cargados e incluso el contexto de la conversación. El modelo entiende el lenguaje de forma avanzada y lo combina con un conocimiento visual detallado, lo que permite generar resultados con un alto nivel de coherencia y profesionalismo.

Una de las mejoras más destacadas de GPT-4o frente a versiones anteriores es su capacidad para manejar escenas con muchos elementos. Mientras otros sistemas presentan limitaciones al representar más de cinco objetos, este modelo puede gestionar composiciones con entre 10 y 20 objetos diferentes, manteniendo la armonía visual y sin perder precisión en los detalles.

Este avance ha sido posible gracias al trabajo conjunto de cientos de entrenadores humanos que, durante más de un año, han perfeccionado la manera en que GPT-4o interpreta instrucciones complejas. Como resultado, la generación de imágenes es ahora más precisa, coherente y adaptada al contexto conversacional.

Aplicaciones prácticas en diversos sectores

La herramienta basada en GPT-4o ofrece soluciones útiles para diseñadores, creadores de contenido, equipos de marketing y educadores. Entre sus usos más comunes se encuentran:

  • Diagramas explicativos, infografías y gráficos para redes sociales.
  • Carteles con contenido textual complejo, como señales, instrucciones o tarjetas de presentación.
  • Imágenes fotorrealistas con iluminación realista, sombras y texturas detalladas.
  • Creación de logotipos y materiales promocionales personalizados.
  • Visualización de conceptos abstractos o históricos discutidos en el chat.

Incluso es posible usar una imagen existente como punto de partida y modificarla: desde redibujar una mascota hasta crear una propuesta decorativa para un espacio real.

Ejemplo creativo con GPT-4o

Un ejemplo que ilustra el potencial del modelo GPT-4o: se puede generar una imagen hiperrealista de dos brujas jóvenes (una con balayage ceniza y otra con cabello castaño rojizo) que observan una señal en una calle de Williamsburg, Nueva York.

El cartel, repleto de señales absurdas, pero visualmente coherentes, hace referencia a estacionamiento de escobas, carga de alfombras mágicas o permisos para renos en Navidad. Esta imagen combina lo fantástico con un entorno realista, y GPT-4o logra mantener la coherencia entre la narrativa y lo visual.

Acceso progresivo a la nueva función

La función de generación de imágenes con GPT-4o ya comenzó a implementarse para los usuarios de ChatGPT Plus, Team, Pro y Free, y también estará disponible en servicios como Sora, ChatGPT Enterprise y ChatGPT Edu en los próximos meses.

Esta nueva capacidad marca un antes y un después en la forma de interactuar con modelos de lenguaje, permitiendo que una simple conversación sea el punto de partida para crear imágenes complejas y detalladas.

Añadir nuevo comentario