"ИИ уже не просто генерирует изображения, он начинает режиссировать фильмы".
Только сегодня был совершен эпохальный прорыв в области искусственного интеллекта для видео -Lightricks официально выпускает LTX-2Новый продукт, который может бытьСоздайте 20-секундное видео высокой четкости с разрешением 4K и частотой 50 кадров в секунду с эффектами звука и синхронизацией губ за один проход.Генеративная модель
Более того:Он уже в сети на сайте ComfyUI.Он поддерживает ввод текста/изображений, создает фильмы за считанные секунды и работает локально!
Если Sora - это трейлер к будущему, то LTX-2 - это трейлер к будущему.Креативные инструменты, которые действительно работают--Он делает реальностью принцип "напиши абзац → сними короткометражку".
🎬 Что такое LTX-2? Это не просто создание видео, это "создание на уровне режиссера".
LTX-2 от известной компании по производству программного обеспечения для творчества Лайтрикс(команда, стоящая за Facetune и Videoleap), в настоящее время это самый популярныйВпервые синхронизированы изображение и звук в одном диффузионном процессевидеомодели.
Core Breakthrough:
- ✅ Синхронизированное создание аудио и видеоПерсонажи говорят ртом, соответствующим их голосу, звуковые эффекты синхронизируются со вспышками света при взрыве, а ритм ходьбы соответствует их шагам;
- ✅ Родной выход 4K / 50 кадров в секунду: Превосходит традиционный стандарт 24 кадр/с для кино и телевидения, без мерцания и структурных разрывов изображения;
- ✅ Мультимодальные входы: Поддерживаются драйверы обычного текста, изображений и эскизов;
- ✅ Тонкий директорский контроль: Вы можете задать траекторию движения камеры, перемещение объектов, стиль освещения и темп клипа;
- ✅ Инициатива с открытым исходным кодомВесовые коэффициенты моделей, коды и контрольные показатели будут доступны в Открытый исходный код в конце ноября 2025 года.;
- ✅ локальная операцияRTX 4090 или Mac Studio готовы к развертыванию, не нужно полагаться на облако.
Это не "анимированная игрушка с искусственным интеллектом".Инструменты профессионального уровня, которые можно использовать непосредственно в рекламных роликах, эскизах и предварительных просмотрах фильмов.
🧪 Реальный пример использования: на что действительно способен LTX-2?
LTX-2 - это не просто "генератор видео", а "искусственный интеллект режиссера", который действительно понимает взаимосвязь между языком камеры, темпом, настроением и звуком. Ниже приведены пять репрезентативных тестовых примеров, основанных на предоставленной вами подсказке и сгенерированных LTX-2 за один раз ---.Графика, действия, диалоги, звуковые эффекты и движение камеры синхронизированы..
✅ Случай 1: Побег с ночных улиц Нью-Йорка - кинематографическое напряжение, нагнетаемое по кругу
Подсказка::
Мужчина тихо говорит: "Нам нужно бежать". Камера приближает его рот и тут же кричит: "СЕЙЧАС!". Камера снова приближает его, он разворачивается и начинает убегать, камера следит за его бегом. Камера снова приближается, он разворачивается и начинает убегать, камера следит за его бегом в стиле hand held. Камера поднимается и показывает, как он убегает вдаль по улице в оживленном ночном Нью-Йорке.
в конце концов::
- Камера медленно приближается к губам мужчины, его дыхание слегка дрожит;
- "СЕЙЧАС!" В тот момент, когда она вспыхивает, звуковые эффекты и камера отрываются от экрана, мерцают уличные фонари и ревет транспорт;
- Действия, выполняемые с помощью ручного управления, естественны и плавны, а шаги соответствуют ритму дыхания;
- Финальный кадр с крана поднимается вверх, когда силуэт мужчины исчезает на неоновых улицах Нью-Йорка, а на заднем плане слышны звуки окружающей среды (сирены, гудки, толпы людей).
Это не "анимация AI", а кадры киношного качества, которые можно использовать непосредственно в начале боевика.
✅ Case 2: Monster Truck Rampage - размытие движения и отслеживание линз!
Подсказка::
кинематографический кадр с грузовиком-монстром, который быстро едет по направлению к камере. Грузовик проезжает мимо камеры, когда она поворачивается влево, чтобы проследить за безрассудной ездой грузовика. Затем грузовик дрифтует и разворачивается, после чего едет обратно к камере, пока не становится виден вдалеке. Грузовик дрифтует и разворачивается, затем едет назад к камере, пока не будет виден вблизи.
в конце концов::
- Грузовик мчится наперерез, шины взбивают пыль, а камера неистово трясется, имитируя съемку с рук;
- Изображение естественным образом размывается при движении, а глубина резкости меняется по мере того, как мимо проезжает автомобиль;
- Дрифт-слалом проходит плавно, рев двигателя синхронизируется со звуком трения шин;
- В конце концов, предельно крупным планом снимаются фары автомобиля, отражающие искаженный свет и тени, а звуковые эффекты резко прекращаются, чтобы создать драматическое напряжение.
Понимание LTX-2 "скорости" и "физической обратной связи" близко к уровню профессиональных команд спецэффектов.
✅ Пример 3: Дневное ток-шоу - эмоциональное напряжение и точность темпа монтажа
Подсказка::
NT. НАБОР ДЛЯ ДНЕВНОГО ТОК-ШОУ - ВТОРАЯ ПОЛОВИНА ДНЯ
Мягкий студийный свет освещает декорации в теплых тонах. Зрители негромко переговариваются, когда камера поворачивается, чтобы показать трех гостей, сидящих на диване - пару средних лет и ведущего шоу, сидящего напротив них. Пара средних лет и ведущий шоу, сидящий напротив них.
Хозяин наклоняется вперед, голос ровный, но испытующий.
Ведущий: "Когда вы впервые заметили, что ваша дочь, Мисси, начала закручиваться?"
Лицо женщины сморщилось; она делает дрожащий вдох и начинает плакать. Ее муж кладет утешительную руку ей на плечо и смотрит вниз, прежде чем повернуться обратно к хозяину. Ее муж кладет руку ей на плечо, смотрит вниз, а затем снова поворачивается к хозяину.
Отец (тихо, с чувством вины): "Мы... мы не знаем, что мы сделали не так".
На мгновение в студии воцаряется тишина. Камера переключается на ведущего, который серьезно смотрит в объектив.
Ведущий: "Давайте посмотрим на небольшой материал, который подготовила наша команда, - хронику нисходящего пути Мисси. Путь вниз".
Свет слегка приглушается, камера наезжает на залитое слезами лицо матери. Студийные мониторы оживают, начиная воспроизводить фрагмент, и зрители затаивают дыхание. Студийные мониторы оживают и начинают воспроизводить фрагмент, когда зрители задерживают дыхание.
в конце концов::
- Изображение восстанавливает классическое освещение и тональность дневных ток-шоу, теплый желтый мягкий свет создает гнетущую атмосферу;
- Мать плачет с помощью тонких микровыражений лица и естественных движений рук мужа;
- Ведущий поворачивается к "четвертой стене" камеры и ломает ее, говоря спокойным тоном и глядя прямо на аудиторию;
- По мере того как камера приближается к заплаканному лицу матери, фоновый звук исчезает, оставляя лишь звук дыхания;
- Суть в следующем.Когда ведущий говорит "Давайте посмотрим...", LTX-2 автоматически генерирует переход "фильм в фильме" - экран загорается, изображение переключается, аудитория задерживает дыхание - и у зрителей перехватывает дыхание. -Экран загорается, изображение переключается, зрители задерживают дыхание...Весь процесс выполняется за один проход, не требуя последующего сращивания.
Это уже не "поколение видео", этоАвтоматическое построение нарративных структур.
✅ Случай 4: абсурдная семейная драма - юмор с мертвой стороны и визуальные контрасты, собранные вместе
Подсказка::
Теплый солнечный двор. Камера берет крупный кинематографический план женщины и мужчины лет 30, стоящих друг напротив друга с серьезным выражением лица. Женщина, эмоциональная и драматичная, негромко говорит: "Вот и все... Папа потерял его. Папа потерял его. И мы потеряли папу".
Мужчина выдыхает, слегка раздражаясь: "Перестань драматизировать, Джесс".
Он отводит взгляд в сторону, а потом защищается: "Он просто развлекается".
Камера медленно поворачивается вправо, показывая дедушку в саду в огромных крыльях бабочки, размахивающего руками в воздухе, как будто он как будто пытается взлететь.
Он кричит "Уииии!", хлопая крыльями с полной отдачей.
Женщина закрывает лицо, на грани слез. Тон бесстрастный, абсурдный и тихо трагический.
в конце концов::
- В начальной сцене двое мужчин стоят лицом друг к другу в унылом настроении, а камера медленно поворачивается вправо;
- На картину врывается дедушка в огромных крыльях бабочки, его движения преувеличены, но ритмически точны;
- "Уиииу!" - закричал он, когда хлопанье крыльев подняло легкий ветерок, и листья слегка затрепетали;
- Реакция дочери, закрывающей лицо, и сына, закатывающего глаза, реальна и естественна;
- Саундтрек сопровождается мягким гитарным саундтреком, который создает "тупиковый комедийный" контраст с абсурдностью образов.
LTX-2 удается уловить тонкий тон "абсурдного и одновременно трагического" - самое сложное в высокой комедии.
✅ Кейс 5: Печной театр в стиле Pixar - антропоморфность + драматизация + синхронизация аудио и видео
Подсказка::
Статическая камера изнутри печи, взгляд наружу через слегка запотевшую стеклянную дверцу. Теплый золотистый свет сияет вокруг свежеиспеченного печенья. Лицо пекаря заполняет кадр, глаза сосредоточены, дыхание затуманивает стекло, когда он наклоняется. Тонкие отражения движутся по стеклу, когда поднимается пар.
Бейкер (шепотом): "Сегодня... я достиг совершенства".
Он наклоняется еще ближе, почти касаясь носом стекла.
"Золотистые края. Мягкая середина. Сами боги почувствуют запах этого печенья и заплачут".
Бейкер: "Подождите..."
(бит)
"Я... забыл шоколадные чипсы?"
Вид сбоку - в кадре появляется коллега, небрежно жующий.
Коллега (с набитым ртом): "Нет. Вы забыли сахар".
Быстрая съемка лица пекаря, прижавшегося к дверце духовки, когда печенье сдувается за стеклом. Пар поднимается вверх в Пар поднимается вверх в замедленной съемке.
Актерская игра и синхронизация в стиле "Пиксар
в конце концов::
- Снимок сделан изнутри печи с видом снаружи, с реалистичными деталями запотевшего стекла, пара и отражений;
- Выражение лица пекаря преувеличено, но не перегружено, а его взгляд переходит от бешенства к опустошению;
- "Сами боги почувствуют запах этого печенья и заплачут" под торжественный саундтрек;
- Коллега внезапно вступает в игру и жует с набитым ртом: "Не-а. Ты забыл про сахар".Форма рта, жевательные звуки и глотательные движения идеально синхронизированы.;
- Бисквит разваливается и поднимается пар в замедленной съемке с душераздирающим звуковым эффектом "дзинь".Точно воспроизведена синхронизация в стиле Pixar..
После того как видео было опубликовано в сообществе, нетизены назвали его "самой целебной и душераздирающей AI-короткометражкой года".
🛠️ Как это работает? ComfyUI - это процесс в один клик.
LTX-2 был принят в качествеОфициальный узел сотрудничестваИнтеграция в ComfyUI с очень низким барьером для использования:
Выполните следующие действия:
- Обновление ComfyUI до последней версии (убедитесь, что видеомодуль поддерживается);
- Поиск в библиотеке шаблонов "LTX-2".;
- Выберите режим:
- Быстрый режим: 6-10 секунд видео для быстрого предварительного просмотра;
- Профессиональный режим: Высокое качество выходного сигнала, подходит для рекламных роликов/короткометражных фильмов;
- Введите слово подсказки, например:
Танцовщица под неоновым светом, кинематографический, 4K, 50 кадров в секунду - Параметры настройки: разрешение (720p~4K), частота кадров (до 50 кадров в секунду), продолжительность (6/8/10 секунд);
- Нажмите кнопку Выполнить.Снимайте за 10 секунд или меньше.
Опытные пользователи также могут объединять узлы ControlNet и VHS для выполнения сложных процессов, таких как сшивка с нескольких камер и перенос стилей.
⚖️ Сильные и слабые стороны
✅ Сильные стороны:
- синхронизация звука и изображения: Впервые в индустрии попрощайтесь с "пост-дубляжом";
- Быстрое рассуждение: 10-секундные видеоролики создаются чуть более чем за 10 секунд;
- Физический реализм: Текстуры кожи, металла и ткани реалистичны;
- Контроль уровня директора: Стрельба, темп и стиль - все это можно регулировать;
- Открытый исходный код + локальная эксплуатацияКонфиденциальность и безопасность без привязки к платформе.
⚠️ Ограничения:
- ограничение по времени: В настоящее время до 10 секунд (20 секунд на официальных платформах);
- Аудио смещение "опорный уровень": Подходит для звуковых эффектов, не заменяет профессиональные саундтреки;
- Высокие требования к графической памятиДля вывода изображения в формате 4K требуется графический процессор класса RTX 4090;
- Чувствительность к сигнальным словам: Расплывчатые описания легко "пристрастны", поэтому их необходимо выражать с точностью.
🔗 Как вам понравилось?
- Опыт работы в Интернете::https://ltx.video/
- Узел ComfyUI: поиск в библиотеке шаблонов "LTX-2"
- Поддерживаемые платформы: Fal, Replicate, RunDiffusion, ComfyUI
- программа с открытым исходным кодом: Открытые веса и код модели в конце ноября 2025 г.
🎥 Пишите в конце
Раньше мы говорили, что "видео, сгенерированное искусственным интеллектом", - это уловка;
Итак, доказательство LTX-2:ИИ получил возможность участвовать в реальном творческом процессе.
Может быть, он и не идеален, но направление движения безошибочно.
Пусть творчество больше не ограничивается техническими рамками, а идеи превращаются в изображения за считанные секунды.
Если вы хотите стать режиссером своего собственного фильма в формате 4K, вы можете сделать это самостоятельно.
Сейчас самое подходящее время для этого.
Откройте ComfyUI и введите первое слово подсказки.
Мир будет двигаться ради вас.