LTX-2.3: el modelo open source que genera vídeo 4K con audio sincronizado
Lightricks lanza LTX-2.3, un modelo open source de 22.000M de parámetros que genera vídeo 4K a 50 FPS con audio nativo sincronizado y ejecución local.
Publicado por BREIA — Categoría: Audiovisual
¿Qué es LTX-2.3 y por qué marca un antes y un después en el vídeo con IA? El 5 de marzo de 2026, Lightricks lanzó LTX-2.3, un modelo de generación de vídeo con inteligencia artificial de 22.000 millones de parámetros bajo licencia Apache 2.0. Lo que lo diferencia de cualquier alternativa anterior es su capacidad de generar vídeo nativo en 4K a 50 fotogramas por segundo con audio sincronizado en un único proceso, sin necesidad de herramientas externas ni pasos adicionales. Además, Lightricks lanzó simultáneamente LTX Desktop , una aplicación en fase beta que permite ejecutar el modelo de forma completamente local en Windows, siempre que el equipo disponga de una GPU NVIDIA RTX de las series 30, 40 o 50. La ejecución local significa que los datos no salen de tu empresa y no hay costes recurrentes por llamadas a API. ¿Qué capacidades técnicas ofrece LTX-2.3 a las empresas? LTX-2.3 llega con mejoras sustanciales respecto a versiones anteriores. Su VAE completamente rediseñado ofrece mayor nitidez en texturas, rostros, cabello y texto. El conector de texto es cuatro veces mayor, lo que se traduce en una generación más fiel al prompt que escribas. Además, incluye soporte nativo para formato 9:16 (vertical), ideal para contenidos de Instagram Reels, TikTok y YouTube Shorts. Modalidades disponibles en el modelo El modelo ofrece siete endpoints distintos : texto a vídeo, imagen a vídeo, audio a vídeo, extender vídeo y rehacer vídeo, con variantes rápidas optimizadas para velocidad. Existen dos modos de generación: Dev (40 pasos, máxima calidad) y Distilled (8 pasos, más velocidad). Los vídeos pueden llegar a durar hasta 20 segundos en 4K . Las empresas que integren LTX-2.3 en su flujo de trabajo pueden: Generar vídeos publicitarios cortos para redes sociales sin costes de producción tradicional. Crear animaciones de producto a partir de imágenes estáticas con audio de producto sincronizado. Producir contenidos verticales para Reels y TikTok con soporte nativo 9:16 sin reencu