LTX-2 ¡voló por los aires! El primer modelo del mundo de generación de vídeo 4K sincronizado con audio y vídeo, ¡compatible con ComfyUI!

"La IA ya no se limita a generar imágenes, sino que empieza a dirigir películas".

Hoy mismo se ha producido un avance histórico en el vídeo de IA: elLightricks lanza oficialmente el LTX-2Se trata de un nuevo producto que puedeGenere vídeos HD narrativos de 20 segundos, resolución 4K y 50 fps, con efectos de sonido completos y sincronización labial en una sola pasada.El modelo generativo de la

Es más:Ya está en línea en ComfyUIAdmite la introducción de texto e imágenes, produce películas en segundos y se ejecuta localmente.

Si Sora es un tráiler del futuro, el LTX-2 es un tráiler del futuro.Herramientas creativas que realmente funcionan--Hace realidad aquello de "escribe un párrafo → consigue un corto".

🎬 ¿Qué es LTX-2? No es solo generación de vídeo, es "creación a nivel de director".

LTX-2 de la prestigiosa empresa de software creativo Lightricks(el equipo detrás de Facetune y Videoleap), es actualmente el más popularPrimera sincronización de imagen y sonido en un único proceso de difusióndel modelo de vídeo.

Core Breakthrough:

  • Generación sincronizada de audio y vídeo: Los personajes hablan con bocas que coinciden con sus voces, efectos sonoros que se sincronizan con los destellos de luz cuando explotan y ritmos de marcha que coinciden con sus pasos;
  • Salida nativa 4K / 50 fps: Supera el estándar tradicional de 24 fps para cine y televisión, sin parpadeos ni rupturas estructurales de la imagen;
  • Entradas multimodales: Se admiten controladores de texto sin formato, imagen y boceto;
  • Fine Director ControlPuede especificar la trayectoria de la cámara, el movimiento del objeto, el estilo de iluminación y el tempo del clip;
  • Iniciativa de Código AbiertoLos pesos, códigos y referencias del modelo estarán disponibles en el Código abierto a finales de noviembre de 2025.;
  • funcionamiento localRTX 4090 o Mac Studio listo para desplegar, sin necesidad de depender de la nube.

No es un "juguete animado con IA".Herramientas de calidad profesional que pueden utilizarse directamente en anuncios, bocetos y avances de películas.

🧪 Caso de uso real: ¿Qué puede hacer realmente la LTX-2?

LTX-2 no es sólo un "generador de vídeo", sino un "director de IA" que realmente entiende la relación entre el lenguaje de la cámara, el ritmo, el estado de ánimo y el sonido. A continuación se muestran cinco casos de prueba representativos, todos ellos basados en el Prompt que usted proporcione, generados por LTX-2 a la vez -.Los gráficos, la acción, los diálogos, los efectos de sonido y los movimientos de cámara están sincronizados..

✅ Caso 1: Fuga de las calles nocturnas de Nueva York - La tensión cinematográfica en su punto álgido

Pregunte a::

El hombre dice en silencio: "Tenemos que huir". La cámara acerca el zoom a su boca e inmediatamente grita: "¡AHORA!". La cámara vuelve a alejar el zoom, él se da la vuelta y empieza a huir, la cámara sigue su huida. La cámara se aleja de nuevo, él se da la vuelta y empieza a huir, la cámara sigue su carrera en estilo cámara en mano. la cámara se eleva y le muestra correr hacia el interior. La cámara se eleva y le muestra corriendo en la distancia por la calle en una ajetreada noche de Nueva York.

al final::

  • La apertura es silenciosa mientras la cámara se acerca lentamente a los labios del hombre, cuya respiración tiembla ligeramente;
  • "¡AHORA!" En el momento en que estalla, los efectos de sonido y la cámara se alejan bruscamente mientras las farolas parpadean y el tráfico ruge;
  • La acción de seguir corriendo con la mano es natural y fluida, con pasos que siguen el ritmo de los jadeos;
  • El plano final de la grúa se eleva mientras la silueta del hombre se desvanece entre las calles de neón de Nueva York, con capas de sonido ambiente (sirenas, bocinas, multitudes) de fondo.

No se trata de una "animación AI", sino de metraje de calidad cinematográfica que puede utilizarse directamente en la apertura de una película de acción.

✅ Caso 2: Monster Truck Rampage - ¡El desenfoque de movimiento se une al seguimiento de la lente!

Pregunte a::

un plano cinematográfico lleno de acción de un camión monstruo conduciendo a toda velocidad hacia la cámara, el camión pasa por delante de la cámara mientras ésta se desplaza hacia la izquierda para seguir la conducción temeraria del camión. A continuación, el camión se desvía y da la vuelta, y luego vuelve hacia la cámara hasta que se ve en la distancia extrema. A continuación, el camión se desvía, gira y vuelve a acercarse a la cámara hasta que se ve en primer plano.

al final::

  • El camión se precipita de frente, los neumáticos arremolinan el polvo y la cámara se sacude violentamente para simular una toma cámara en mano;
  • La imagen produce naturalmente desenfoque de movimiento y la profundidad de campo cambia al paso del vehículo;
  • La acción de slalom en derrape es suave, con el motor rugiendo en sincronía con el sonido de la fricción de los neumáticos;
  • Finalmente, el primer plano extremo se posa sobre los faros del coche, reflejando luces y sombras distorsionadas, y los efectos sonoros se detienen bruscamente para crear una tensión dramática.

La comprensión que tiene LTX-2 de la "velocidad" y la "respuesta física" se acerca al nivel de los equipos profesionales de efectos especiales.

✅ Caso 3: Talk Show diurno - Tensión emocional y precisión del ritmo de edición

Pregunte a::

NT. TALK SHOW DIURNO - TARDE
El público murmura débilmente mientras la cámara se desplaza para mostrar a tres invitados sentados en un sofá: una pareja de mediana edad y el presentador del programa sentado frente a ellos. una pareja de mediana edad y el presentador del programa sentado frente a ellos.
El anfitrión se inclina hacia delante, con voz firme pero penetrante.
Presentador: "¿Cuándo notó por primera vez que su hija, Missy, empezaba a entrar en barrena?".
El rostro de la mujer se encoge, respira entrecortadamente y empieza a llorar. Su marido le pone una mano en el hombro para consolarla, baja la mirada y se vuelve hacia el anfitrión. Su marido le pone una mano en el hombro, la mira y se vuelve hacia el anfitrión.
Padre (en voz baja, con culpa): "Nosotros... no sabemos qué hicimos mal".
El estudio se queda en silencio un momento y la cámara se dirige al presentador, que mira seriamente al objetivo.
Presentador (a cámara): "Echemos un vistazo a una pieza corta que nuestro equipo preparó - crónica del camino descendente de Missy. camino descendente".
Las luces se atenúan ligeramente cuando la cámara enfoca el rostro bañado en lágrimas de la madre. Los monitores del estudio parpadean y comienzan a reproducir el segmento mientras el público contiene la respiración. Los monitores del estudio parpadean y comienzan a reproducir el segmento mientras el público contiene la respiración.

al final::

  • La imagen recupera la iluminación y los tonos clásicos de las tertulias diurnas, con una luz amarilla cálida y suave que crea una atmósfera deprimente;
  • La madre llora con sutiles microexpresiones faciales y los movimientos naturales de la mano del marido;
  • El presentador se dirige a la "cuarta pared" de la cámara y la rompe, hablando en tono tranquilo y mirando directamente al público;
  • A medida que la cámara se acerca al rostro lloroso de la madre, el sonido de fondo se desvanece, dejando sólo el sonido de la respiración;
  • La conclusión es la siguiente.Cuando el presentador dice "Echemos un vistazo...", la LTX-2 genera automáticamente una transición de "película dentro de película": la pantalla se ilumina, la imagen cambia, el público contiene la respiración... y el público se queda sin aliento. -La pantalla se ilumina, la imagen cambia, el público contiene la respiración...Todo el proceso se realiza de una sola vez, sin necesidad de empalmes posteriores a la producción..

Ya no es "generación de vídeo", esConstrucción automática de estructuras narrativas.

✅ Caso 4: Drama familiar absurdo - Humor del lado muerto y contrastes visuales tirados de los pelos

Pregunte a::

Un patio soleado y cálido. La cámara comienza en un primer plano cinematográfico de una mujer y un hombre de unos 30 años, uno frente al otro con expresiones serias. La mujer, emocionada y dramática, dice en voz baja: "Ya está... Papá lo ha perdido. Papá lo ha perdido. Y nosotros hemos perdido a papá".
El hombre exhala, ligeramente molesto: "Deja de ser tan dramática, Jess".
Mira a un lado y murmura a la defensiva: "Sólo se está divirtiendo".
La cámara se desplaza lentamente hacia la derecha, mostrando al abuelo en el jardín con unas enormes alas de mariposa, agitando los brazos en el aire como si intentara despegar. intentando despegar.
Grita "¡Wheeew!" mientras bate las alas con total entrega.
La mujer se cubre la cara, al borde de las lágrimas. El tono es inexpresivo, absurdo y tranquilamente trágico.

al final::

  • La escena inicial muestra a los dos hombres frente a frente en un ambiente deprimente mientras la cámara se desplaza lentamente hacia la derecha;
  • El abuelo irrumpe en el cuadro con unas enormes alas de mariposa, sus movimientos exagerados pero rítmicamente precisos;
  • "¡Wheeew!" Gritó mientras el batir de alas levantaba una ligera brisa y las hojas se agitaban ligeramente;
  • La reacción de la hija tapándose la cara y del hijo poniendo los ojos en blanco es real y natural;
  • La banda sonora se acompaña de una suave banda sonora de guitarra, que crea un contraste de "comedia muerta" con el absurdo de las imágenes.

LTX-2 consigue captar el sutil tono de "absurdo pero trágico", la parte más difícil de la alta comedia.

✅ Caso 5: Teatro en el horno al estilo Pixar - Antropomorfismo + Dramatización + Sincronización de audio y vídeo

Pregunte a::

Cámara estática desde el interior del horno, mirando hacia el exterior a través de la puerta de cristal ligeramente empañada. Una cálida luz dorada brilla alrededor de las galletas recién horneadas. La cara del panadero llena el encuadre, con los ojos muy abiertos y la respiración empañando el cristal mientras se inclina hacia dentro. Sutiles reflejos se mueven a través del cristal mientras sube el vapor.
Baker (susurrando dramáticamente): "Hoy... alcanzo la perfección".
Se inclina aún más, la nariz casi rozando el cristal.
"Bordes dorados. Centro blando. Los mismos dioses olerán estas galletas y llorarán".
Baker: "Espera..."
(ritmo)
"¿Se me... olvidaron las chispas de chocolate?"
Corte a la vista lateral - compañero de trabajo aparece en el cuadro, masticando casualmente.
Compañero de trabajo (con la boca llena): "No. Se te ha olvidado el azúcar".
Zoom rápido a la cara horrorizada del panadero, apretado contra la puerta del horno, mientras las galletas se desinflan detrás del cristal. El vapor sube a cámara lenta. El vapor sube a cámara lenta.
actuación y sincronización al estilo pixar

al final::

  • La toma está realizada desde el interior del horno mirando hacia fuera, con detalles realistas de vaho de cristal, vapor y reflejos;
  • La expresión del panadero es exagerada pero no exagerada, y sus ojos pasan del frenesí a la devastación;
  • "Los mismísimos dioses olerán estas galletas y llorarán" con una solemne banda sonora;
  • Un colega entra en escena de repente y mastica con la boca llena: "No, se te ha olvidado el azúcar"...La forma de la boca, los sonidos de masticación y los movimientos de deglución están perfectamente sincronizados..;
  • La galleta se derrumba y el vapor sube a cámara lenta, con un desgarrador efecto de sonido "ding".La sincronización al estilo Pixar se reproduce con precisión..

Tras la difusión del vídeo en la comunidad, los internautas lo calificaron como "el cortometraje de IA más sanador y desgarrador del año".

🛠️ ¿Cómo funciona? ComfyUI es un proceso de un solo clic.

LTX-2 se ha adoptado comoNodo Oficial de CooperaciónIntegración en ComfyUI con una barrera de uso muy baja:

Los pasos son los siguientes:

  1. Actualizar ComfyUI a la última versión (asegúrate de que el módulo de vídeo es compatible);
  2. Buscar en la biblioteca de plantillas "LTX-2".;
  3. Selecciona el modo:
  • Modo rápido6-10 segundos de vídeo para previsualizaciones rápidas;
  • Modo ProSalida de alta calidad, adecuada para anuncios y cortometrajes;
  1. Introduzca la palabra clave, por ejemplo:
    una bailarina bajo luz de neón, cinematográfico, 4K, 50fps
  2. Parámetros de ajuste: resolución (720p~4K), frecuencia de imagen (hasta 50fps), duración (6/8/10 segundos);
  3. Haga clic en Ejecutar.Película en 10 segundos o menos.

Los usuarios avanzados también pueden combinar nodos ControlNet y VHS para procesos complejos como la unión de varias cámaras y la migración de estilos.

⚖️ Puntos fuertes y limitaciones

✅ Puntos fuertes:

  • sincronización entre sonido e imagen: Por primera vez en la industria, despídete del "postdoblaje";
  • Razonamiento rápido: los vídeos de 10 segundos se generan en poco más de 10 segundos;
  • Realismo físicoLas texturas de la piel, el metal y la tela son realistas;
  • Control del nivel del directorLos disparos, el tempo y el estilo son ajustables;
  • Código abierto + funcionamiento localPrivacidad y seguridad sin bloqueo de plataforma.

⚠️ limitaciones:

  • límite de tiempoActualmente hasta 10 segundos (20 segundos en plataformas oficiales);
  • Audio bias "nivel de referencia": Adecuado para efectos de sonido ambiental, no sustituye por el momento a las bandas sonoras profesionales;
  • Altos requisitos de memoria gráfica4K requiere una GPU de tipo RTX 4090;
  • Sensibilidad a las palabras clave: Las descripciones vagas son fácilmente "tendenciosas" y deben expresarse con precisión.

🔗 ¿Qué tal la experiencia?

  • Experiencia en línea::https://ltx.video/
  • Nodo ComfyUI: Biblioteca de plantillas Buscar "LTX-2"
  • Plataformas compatibles: Fal, Replicar, RunDiffusion, ComfyUI
  • programa de código abierto: Pesos y código del modelo abierto a finales de noviembre de 2025

🎥 Escribe al final

Antes decíamos que el "vídeo generado por inteligencia artificial" era un truco;
Ahora, la prueba LTX-2:La IA ha podido participar en el verdadero proceso creativo.

Puede que no sea perfecto, pero la dirección es inequívoca...
Deja que la creatividad deje de estar limitada por el umbral técnico, para que la idea pueda convertirse en imagen en cuestión de segundos.

Si quieres "dirigir" tu propia película en 4K, puedes hacerlo tú mismo.
Ahora es el mejor momento para hacerlo.

Abre ComfyUI y escribe tu primera palabra.
El mundo, se moverá por ti.

Para más productos, visite

Más información en

ShirtAI - Inteligencia penetrante El Gran Modelo AIGC: el comienzo de una era de doble revolución en ingeniería y ciencia - Inteligencia Penetrante
Restauración 1:1 de Claude y GPT Sitio web oficial - AI Cloud Native Live Match App Global HD Sports Viewing Player (Recomendada) - Blueshirt Technology
Servicio de tránsito basado en la API oficial - GPTMeta API Ayuda, ¿alguien de ustedes puede proporcionar algunos consejos sobre cómo hacer preguntas en GPT? - Conocimientos
Tienda digital global de bienes virtuales - Global SmarTone (Feng Ling Ge) ¿Qué tan poderoso es Claude airtfacts característica que GPT al instante no huele bien? -BeepBeep