O LTX-2 explodiu! O primeiro modelo de geração de vídeo 4K sincronizado com áudio e vídeo do mundo, suportado pela ComfyUI!

"A IA já não está apenas a gerar imagens, está a começar a realizar filmes".

Hoje mesmo, um avanço histórico no vídeo com IA - oA Lightricks lança oficialmente o LTX-2Um novo produto que pode serGerar vídeo HD de 20 segundos, resolução 4K, 50 fps, de nível narrativo, com efeitos sonoros completos e sincronização labial numa única passagem.O modelo generativo do

Mais concretamente:Já está em linha na ComfyUISuporta a introdução de texto/imagem, produz filmes em segundos e funciona localmente!

Se Sora é um trailer para o futuro, o LTX-2 é um trailer para o futuro.Ferramentas criativas que funcionam de facto--Torna realidade a frase "escrever um parágrafo → obter uma curta-metragem".

O que é o LTX-2? Não é apenas a geração de vídeo, é a "criação ao nível do realizador".

LTX-2 da famosa empresa de software criativo Lightricks(a equipa por detrás do Facetune e do Videoleap), é atualmente o mais popularPrimeiro a sincronizar imagem e som num único processo de difusãodo modelo de vídeo.

Descoberta do núcleo:

  • Geração sincronizada de áudio e vídeoA voz das personagens é sincronizada com as suas vozes, os efeitos sonoros são sincronizados com os flashes de luz quando explodem e os ritmos de marcha são sincronizados com os seus passos;
  • Saída nativa 4K / 50fpsUltrapassa o padrão tradicional de 24 fps para filmes e televisão, sem cintilação ou quebra estrutural da imagem;
  • Entradas multimodaisDrivers de texto simples, imagem e esboço são suportados;
  • Controlo de Diretor FinoPode especificar o percurso da câmara, o movimento do objeto, o estilo de iluminação e o tempo do clip;
  • Iniciativa de fonte aberta completaOs modelos de ponderações, códigos e valores de referência estarão disponíveis no Código aberto no final de novembro de 2025.;
  • funcionamento localRTX 4090 ou Mac Studio prontos a implementar, sem necessidade de recorrer à cloud.

Não se trata de um "brinquedo animado com IA".Ferramentas de nível profissional que podem ser utilizadas diretamente em anúncios, esboços e pré-visualizações de filmes.

Caso de utilização na vida real: O que é que o LTX-2 pode realmente fazer?

O LTX-2 não é apenas um "gerador de vídeo", mas um "diretor de IA" que compreende verdadeiramente a relação entre a linguagem da câmara, o ritmo, o humor e o som. A seguir estão cinco casos de teste representativos, todos baseados no Prompt que você forneceu, gerados pelo LTX-2 de uma vez -Os gráficos, a ação, o diálogo, os efeitos sonoros e o movimento da câmara estão todos sincronizados.

Caso 1: Fuga das ruas nocturnas de Nova Iorque - Tensão cinematográfica em círculo completo

Prompt::

O homem diz silenciosamente: "Temos de fugir." A câmara aproxima a sua boca e depois grita imediatamente: "AGORA!". A câmara faz um zoom para trás, ele vira-se e começa a fugir, a câmara segue a sua fuga. A câmara faz um zoom para trás, ele vira-se e começa a fugir, a câmara segue a sua corrida em estilo de mão. A câmara levanta-se e mostra-o a correr para A câmara levanta-se e mostra-o a correr ao longe, ao fundo da rua, numa noite movimentada de Nova Iorque.

no final::

  • A abertura é silenciosa enquanto a câmara se aproxima lentamente dos lábios do homem, cuja respiração treme ligeiramente;
  • "AGORA!" No momento em que irrompe, os efeitos sonoros e a câmara afastam-se enquanto as luzes da rua piscam e o trânsito ruge;
  • A ação de correr à mão é natural e fluida, com passos que acompanham o ritmo dos suspiros;
  • O plano final da grua sobe à medida que a silhueta do homem se desvanece nas ruas de néon de Nova Iorque, com camadas de som ambiente (sirenes, buzinas, multidões) em segundo plano.

Não se trata de uma "animação de IA", mas de imagens com qualidade cinematográfica que podem ser utilizadas diretamente na abertura de um filme de ação.

Caso 2: Monster Truck Rampage - A desfocagem de movimento e o seguimento da lente!

Prompt::

um plano cinematográfico cheio de ação de um camião monstruoso a conduzir rapidamente em direção à câmara, o camião passa pela câmara enquanto esta se desloca para a esquerda para seguir a condução imprudente do camião. O camião desvia-se e vira-se, depois volta a dirigir-se para a câmara até ser visto a uma distância extrema. O camião desvia-se e vira-se, depois volta a dirigir-se para a câmara até ser visto em grande plano.

no final::

  • O camião avança de frente, com os pneus a levantar poeira, e a câmara treme violentamente para simular uma filmagem à mão;
  • A imagem produz naturalmente uma desfocagem de movimento e a profundidade de campo altera-se à medida que o veículo passa;
  • A ação do drift slalom é suave, com o motor a rugir em sincronia com o som da fricção dos pneus;
  • Por fim, o plano em grande plano fixa-se nos faróis do carro, reflectindo luz e sombras distorcidas, e os efeitos sonoros param abruptamente para criar uma tensão dramática.

A compreensão de "velocidade" e "feedback físico" do LTX-2 está próxima do nível das equipas profissionais de efeitos especiais.

Caso 3: Programa de entrevistas diurno - Tensão emocional e precisão do ritmo de edição

Prompt::

NT. PROGRAMA DE ENTREVISTAS DIURNO - TARDE
O público murmura levemente enquanto a câmara faz uma panorâmica para revelar três convidados sentados num sofá - um casal de meia-idade e o apresentador do programa sentado em frente a eles. um casal de meia-idade e o apresentador do espetáculo sentado em frente a eles.
O anfitrião inclina-se para a frente, com uma voz firme mas penetrante.
Apresentador: "Quando é que reparou pela primeira vez que a sua filha, Missy, começou a entrar numa espiral?"
O marido coloca uma mão reconfortante no ombro da mulher, olhando para baixo antes de se virar para o anfitrião. O marido coloca uma mão reconfortante no ombro dela, olhando para baixo antes de se voltar para o anfitrião.
Pai (em voz baixa, com culpa): "Nós... não sabemos o que fizemos de errado".
O estúdio fica em silêncio por um momento. A câmara corta para o apresentador, que olha gravemente para a objetiva.
Apresentador (para a câmara): "Vamos ver um pequeno artigo que a nossa equipa preparou - contando o percurso descendente da Missy. caminho descendente".
As luzes diminuem ligeiramente à medida que a câmara se aproxima do rosto da mãe, que está cheio de lágrimas. Os monitores do estúdio ganham vida, começando a passar o segmento enquanto o público sustém a respiração. Os monitores do estúdio ganham vida, começando a passar o segmento enquanto o público sustém a respiração.

no final::

  • A imagem recupera a iluminação e os tons clássicos dos talk shows diurnos, com uma luz suave amarela quente que cria uma atmosfera deprimente;
  • A mãe chora com microexpressões faciais subtis e com os movimentos naturais das mãos do marido;
  • O apresentador vira-se para a "quarta parede" da câmara e quebra-a, falando num tom calmo e olhando diretamente para o público;
  • À medida que a câmara se aproxima do rosto choroso da mãe, o som de fundo desvanece-se, deixando apenas o som da respiração;
  • O resultado final é o seguinte.Quando o apresentador diz "Vamos dar uma olhadela...", o LTX-2 gera automaticamente uma transição "filme dentro de um filme" - o ecrã ilumina-se, a imagem muda, a audiência sustém a respiração - e a audiência fica sem fôlego. O ecrã acende-se, a imagem muda, o público sustém a respiração - e o público fica sem fôlego.Todo o processo é efectuado de uma só vez, sem necessidade de emendas na pós-produção.

Já não se trata de "geração de vídeo", mas sim deConstrução automática de estruturas narrativas.

Caso 4: Drama Familiar Absurdo - Humor do Lado Morto e Contrastes Visuais Juntos

Prompt::

A câmara começa com um grande plano cinematográfico de uma mulher e de um homem na casa dos 30 anos, de frente um para o outro, com expressões sérias. A mulher, emocionada e dramática, diz baixinho: "É isso... o pai perdeu-o. O pai perdeu-o. E nós perdemos o pai". O pai perdeu-o. E nós perdemos o pai".
O homem exala, ligeiramente irritado: "Pára de ser tão dramático, Jess".
Ele olha para o lado e depois murmura na defensiva: "Ele só se está a divertir".
A câmara vira-se lentamente para a direita, revelando o avô no jardim com enormes asas de borboleta, agitando os braços no ar como se estivesse a tentar como se estivesse a tentar levantar voo.
Ele grita: "Wheeeew!" enquanto bate as asas com todo o empenho.
A mulher tapa a cara, à beira das lágrimas. O tom é impassível, absurdo e discretamente trágico.

no final::

  • A cena de abertura mostra os dois homens frente a frente, num ambiente deprimente, enquanto a câmara se desloca lentamente para a direita;
  • O avô irrompe no quadro com enormes asas de borboleta, os seus movimentos são exagerados mas ritmicamente precisos;
  • "Wheeeew!", gritou, enquanto o bater das asas fazia levantar uma ligeira brisa e as folhas abanavam ligeiramente;
  • A reação da filha que tapa a cara e do filho que revira os olhos é real e natural;
  • A banda sonora é acompanhada por uma banda sonora de guitarra suave, que cria um contraste de "comédia do lado morto" com o absurdo das imagens.

LTX-2 consegue captar o tom subtil de "absurdo mas trágico" - a parte mais difícil da alta comédia.

Caso 5: Teatro de Forno ao estilo Pixar - Antropomórfico + Dramatização + Sincronização de áudio e vídeo

Prompt::

Câmara estática do interior do forno, olhando para o exterior através da porta de vidro ligeiramente embaciada. Luz dourada quente brilha à volta de biscoitos acabados de fazer. O rosto do padeiro preenche o enquadramento, com os olhos arregalados de concentração, a sua respiração a embaciar o vidro enquanto se inclina para dentro. Reflexos subtis movem-se através do vidro à medida que o vapor sobe.
Padeiro (sussurrando dramaticamente): "Hoje... atinjo a perfeição".
Ele inclina-se ainda mais, com o nariz quase a tocar no vidro.
"Bordos dourados. Centro macio. Os próprios deuses sentirão o cheiro destes biscoitos e chorarão."
Baker: "Espera..."
(bater)
"Será que... me esqueci das pepitas de chocolate?"
Corta para a vista lateral - o colega de trabalho aparece na imagem, mastigando casualmente.
Colega de trabalho (com a boca cheia): "Não, esqueceste-te do açúcar".
Zoom rápido de volta ao rosto horrorizado do padeiro, pressionado contra a porta do forno, enquanto os biscoitos se esvaziam atrás do vidro. O vapor sobe em O vapor sobe em câmara lenta.
atuação e timing ao estilo da Pixar

no final::

  • A fotografia é tirada do interior do forno, olhando para fora, com pormenores realistas de névoa de vidro, vapor e reflexos;
  • A expressão do padeiro é exagerada, mas não exagerada, e os seus olhos vão do frenesim à devastação;
  • "Os próprios deuses sentirão o cheiro destes biscoitos e chorarão" ao som de uma banda sonora solene;
  • Um colega entra de repente em cena, mastigando com a boca cheia: "Não. Esqueceste-te do açúcar.A forma da boca, os sons de mastigação e os movimentos de deglutição estão perfeitamente sincronizados.;
  • O biscoito cai e o vapor sobe em câmara lenta, com um efeito sonoro de "ding" de partir o coração.A sincronização ao estilo Pixar é reproduzida com exatidão..

Depois de o vídeo ter sido divulgado na comunidade, os internautas chamaram-lhe "a curta-metragem de IA mais curativa e comovente do ano".

🛠️ Como funciona? ComfyUI é um processo de um clique.

O LTX-2 foi adotado comoNó de cooperação oficialIntegração no ComfyUI com uma barreira de utilização muito baixa:

Os passos são os seguintes:

  1. Atualizar ComfyUI para a versão mais recente (certifique-se de que o módulo de vídeo é suportado);
  2. Pesquisar na biblioteca de modelos "LTX-2".;
  3. Selecionar o modo:
  • Modo rápido: 6-10 segundos de vídeo para pré-visualizações rápidas;
  • Modo ProSaída de alta qualidade, adequada para anúncios/curtas-metragens;
  1. Introduzir a palavra de comando, por exemplo:
    uma bailarina à luz de néon, cinematográfico, 4K, 50fps
  2. Parâmetros de definição: resolução (720p~4K), taxa de fotogramas (até 50 fps), duração (6/8/10 segundos);
  3. Clique em Executar.Filme em 10 segundos ou menos.

Os utilizadores avançados também podem combinar nós ControlNet e VHS para processos complexos, como a costura de várias câmaras e a migração de estilos.

⚖️ Pontos fortes e limitações

Pontos fortes:

  • sincronização entre som e imagem: Pela primeira vez no sector, diga adeus à "pós-dublagem";
  • Raciocínio rápido: os vídeos de 10 segundos são gerados em pouco mais de 10 segundos;
  • Realismo físicoTexturas de pele, metal e tecido são realistas;
  • Controlo ao nível do diretorTiros, ritmo e estilo são todos ajustáveis;
  • Fonte aberta + funcionamento localPrivacidade e segurança sem dependência de plataforma.

⚠️ limitações:

  • limite de tempoAtualmente, até 10 segundos (20 segundos nas plataformas oficiais);
  • Polarização de áudio "nível de referência"Indicado para efeitos de som ambiente, não substitui, por enquanto, as bandas sonoras profissionais;
  • Requisitos elevados de memória gráfica: a saída 4K requer uma GPU da classe RTX 4090;
  • Sensibilidade à palavra-chaveDescrição: As descrições vagas são facilmente "enviesadas" e devem ser expressas com precisão.

Como é que foi a experiência?

  • Experiência online::https://ltx.video/
  • Nó ComfyUI: Pesquisa na biblioteca de modelos "LTX-2"
  • Plataformas suportadas: Fal, Replicar, RunDiffusion, ComfyUI
  • programa de fonte aberta: Abrir as ponderações e o código do modelo no final de novembro de 2025

🎥 Escrever no fim

No passado, dissemos que o "vídeo gerado por IA" era um truque;
Agora, a prova LTX-2:A IA tem sido capaz de participar no verdadeiro processo criativo.

Pode não ser perfeito, mas a direção é inconfundível.
Deixar que a criatividade deixe de estar limitada pelo limiar técnico, para que a ideia possa ser transformada numa imagem em segundos.

Se quiser "realizar" o seu próprio filme 4K, pode fazê-lo você mesmo.
Esta é a melhor altura para o fazer.

Abra o ComfyUI e introduza a sua primeira palavra de comando.
O mundo mover-se-á por si.

Para mais produtos, consultar

Ver mais em

ShirtAI - Inteligência penetrante O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge) Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep