A finales de septiembre se presentó el modelo fundacional de Meta, la generación de contenido llamado Expressive Media Universe (EMU) con dos herramientas que facilitan la edición de imágenes de forma precisa y la generación de video a partir de descripciones e imágenes.
En ese entonces, la empresa de Mark Zuckerberg precisó que una de estas herramientas se centra en el control de la edición de imágenes a partir de instrucciones de texto; mientras que la otra facilita la generación de vídeos a partir de una descripción de texto con modelos de difusión.
Con EMU edit, Meta introduce «un enfoque novedoso» para optimizar este proceso y mejorar la precisión. Esta herramienta «sigue con precisión las instrucciones, lo que garantiza que los píxeles de la imagen de entrada que no estén relacionados con las instrucciones permanezcan intactos», precisan desde la empresa tecnológica.
La segunda herramienta es EMU video. Con esta segunda opción se ejecutan tareas de generación de vídeo que responde a entradas de distinto tipo, ya sea de solo texto, de solo imagen o de texto e imagen.
Con Emu Video y Emu Edit se «podrían ayudar a las personas a expresarse de nuevas maneras», finalizan en el texto.