De la idea a la imagen en segundos: Ahora GPT-4o crea ilustraciones hiperrealistas
OpenAI ha dado un paso más en la evolución de la inteligencia artificial generativa al incorporar directamente la capacidad de creación de imágenes dentro de ChatGPT, eliminando la dependencia de DALL·E 3 como modelo externo.
Esta actualización, disponible para usuarios gratuitos y suscriptores de los planes Plus, Team y Enterprise, marca un antes y después en la generación de contenido multimodal, consolidando a GPT-4o como una herramienta integral capaz de procesar y producir texto, audio, vídeo e imágenes sin intermediarios.
El fin de una era: ¿Adiós a DALL·E 3?
Hasta ahora, ChatGPT funcionaba como un intermediario para DALL·E 3, el modelo especializado en imágenes basado en difusión, una técnica que reconstruye gráficos eliminando ruido progresivamente. Sin embargo, GPT-4o rompe con ese paradigma al adoptar un enfoque autorregresivo, generando imágenes secuencialmente (de izquierda a derecha y de arriba a abajo), lo que mejora la coherencia visual y la precisión en escenas complejas.
Aunque DALL·E 3 ya no será el motor predeterminado, OpenAI asegura que seguirá accesible mediante un GPT personalizado para quienes prefieran su estilo clásico. No obstante, la migración hacia GPT-4o refleja la apuesta de la compañía por un modelo unificado que supere las limitaciones de sus predecesores.
¿Qué hace único a GPT-4o en generación de imágenes?
Lanzado en mayo de 2024, GPT-4o se distingue por su capacidad «omnimodal», es decir, puede interpretar y generar múltiples formatos (texto, voz, vídeo e imágenes) de manera interconectada. Sin embargo, su funcionalidad para crear imágenes había permanecido en segundo plano hasta ahora. Estas son sus mejoras clave:
1. Texto legible y preciso
Uno de los mayores dolores de cabeza en la IA generativa ha sido la incapacidad de renderizar texto claro dentro de las imágenes. GPT-4o resuelve este problema con una notable precisión, permitiendo la creación de carteles, infografías o menús con tipografías bien definidas y posicionadas.
2. Mayor capacidad para manejar objetos complejos
Mientras modelos anteriores solo podían representar entre 5 y 8 elementos en una escena sin perder coherencia, GPT-4o maneja entre 10 y 20 objetos con atributos detallados (colores, formas, disposición espacial). Esto es posible gracias a mejoras en el binding (asociación de características), esencial para diseños sofisticados.
3. Adaptabilidad estilística y realismo
El modelo no se limita a un único estilo. Puede producir desde bocetos minimalistas hasta fotografías hiperrealistas, e incluso transformar imágenes subidas por el usuario para adaptarlas a un nuevo contexto visual.
4. Integración contextual con ChatGPT
Al ser nativo de ChatGPT, GPT-4o aprovecha el historial de conversación para mantener coherencia en iteraciones sucesivas. Por ejemplo, si un usuario diseña un personaje para un videojuego, el modelo conservará sus rasgos en versiones posteriores.
Aplicaciones prácticas: Más allá del arte
La generación de imágenes con GPT-4o no es solo un avance técnico; tiene implicaciones concretas en diversos campos:
Diseño gráfico y branding: Creación rápida de logotipos, banners y material publicitario.
Educación: Ilustraciones científicas, mapas históricos y recursos didácticos visuales.
Desarrollo de videojuegos: Conceptualización de personajes y escenarios con consistencia estilística.
Marketing digital: Generación de contenido para redes sociales y presentaciones corporativas.
Además, los usuarios pueden especificar proporciones, códigos de color hexadecimales y fondos transparentes, lo que amplía su utilidad en entornos profesionales.
Limitaciones y desafíos pendientes
Pese a sus avances, GPT-4o no está exento de fallos. Entre las limitaciones observadas destacan:
Recortes accidentales en imágenes verticales extensas (como pósteres).
Dificultad con caracteres no latinos y texto muy pequeño.
Problemas al editar zonas específicas sin afectar el resto de la composición.
OpenAI ha reconocido estos inconvenientes y promete solucionarlos en futuras actualizaciones.
Seguridad y ética: ¿Cómo evita OpenAI el mal uso?
La compañía ha implementado medidas para prevenir abusos:
Metadatos C2PA: Todas las imágenes llevan una etiqueta invisible que certifica su origen en IA.
Moderación de contenido: Bloqueo automático de solicitudes que involucren violencia, deepfakes o material pornográfico.
Política flexible con figuras públicas: Permite su representación en contextos educativos o satíricos, aunque pueden solicitar su exclusión.

ChatGPT como «navaja suiza» digital: La estrategia de OpenAI
Con esta actualización, OpenAI consolida a ChatGPT como una plataforma multifuncional que compite con herramientas especializadas como MidJourney o Adobe Firefly. Durante un evento reciente, Sam Altman, CEO de OpenAI, demostró cómo los usuarios pueden refinar imágenes mediante conversaciones iterativas:
«Pide un caracol en una ciudad, añade un sombrero y cambia el fondo… todo en segundos».
Esta fluidez busca atraer tanto a usuarios casuales como a empresas, especialmente en diseño y marketing. Además, la próxima integración vía API permitirá a desarrolladores incorporar estas capacidades en sus propias aplicaciones.
La competencia se intensifica
OpenAI no es el único actor en este campo. Rivales como xAI (de Elon Musk) y Google DeepMind también han lanzado generadores de imágenes avanzados. No obstante, la ventaja de GPT-4o radica en su integración nativa con un chatbot ya masificado, lo que podría inclinar la balanza a su favor.
La fusión de generación de imágenes en ChatGPT no es solo una mejora técnica; es un paso hacia un futuro donde la IA será una extensión natural de la creatividad humana. Aunque persisten desafíos, GPT-4o establece un nuevo estándar en accesibilidad y versatilidad.
Queda por ver cómo reaccionará la industria y si los usuarios adoptarán esta herramienta para usos cotidianos. Pero una cosa es clara: la inteligencia artificial avanza hacia un modelo donde el texto, la voz y lo visual convergen en una sola experiencia.
Te puede interesar: El secreto de Sam Altman para alcanzar el éxito
Más Mercado
Con tu suscripción de Mercado, accedes a una experiencia premium dentro de nuestra plataforma web y a todo lo que The New York Times tiene para ofrecer.
Incluye: News, Games, Cooking, Audio, Wirecutter y The Athletic.
¿Ya eres miembro? Inicia sesión
Mensual
Anual
Digital
Menos de RD$ 500 al mes
RD$5,500 / año
Cobro único el primer año, luego RD$ 9,900 / año.
SuscríbeteSemestral
Digital
RD$3,575 / semestral
Cobro semestral. Primer año RD$ 3,575; luego RD$ 6,435 / semestre.
SuscríbeteTodo lo que incluye tu suscripción:
Seguir leyendo
Carlos Cabrera, el sacerdote dominicano que cantó ante el Papa León XIV en Madrid
Lo más visto en Revista Mercado
Análisis para suscriptores
Hong Kong supera a Suiza y redefine el mapa mundial de las grandes fortunas
Exclusivo Suscriptores
Los millonarios inesperados de SpaceX
Exclusivo Suscriptores
El Mundial pondrá a prueba la imagen que México quiere proyectar al mundo
Exclusivo Suscriptores
Quién liderará las IPO de OpenAI y Anthropic
Exclusivo Suscriptores