Luego de provocar el mayor desvanecimiento de capital en la historia de Wall Street con la presentación de su modelo R1, DeepSeek lanzó Janus Pro 7B, un modelo de IA para generar imágenes a partir de texto y entender otras imágenes que se le introduzcan.
Y al igual que el modelo presentado ayer, este motor también es de código abierto y presenta varios avances en comparación con motores como Midjourney o Freepik.
Hasta ahora, los modelos multimodales han tenido que hacer malabares entre la comprensión y la generación de imágenes, sacrificando eficiencia o rendimiento. Janus Pro 7B resuelve este dilema con una nueva propuesta: unifica la comprensión y generación de imágenes en una única arquitectura.

En qué se diferencia la nueva herramienta de DeepSeek
La innovación de este modelo es introducir un sistema de "doble vía" para el procesamiento visual, que separa los caminos de codificación para entender y generar imágenes.
La arquitectura de Janus Pro 7B es especialmente relevante por su eficiencia y su tamaño compacto de 7.000 millones ("7B") de parámetros. Su rendimiento es superior a modelos específicos más grandes.

Utiliza código abierto con licencia DeepSeek, que es gratuita y permite usos comerciales, pero incluye restricciones éticas específicas, como la prohibición de uso militar o la generación de desinformación.
Janus Pro 7B no es solo otro modelo multimodal, sino un nuevo paradigma en la arquitectura de IAs que pueden ver y crear. Su enfoque unificado pero descentralizado bien puede acabar influyendo en futuros desarrollos.
