Видео от обычного человека (меня), не профессионала, который сидит постоянно в нейросетях и зарабатывает видео. С промтом, пояснениями, промежуточными генерациями. То есть и вы сами сможете сделать такое.
А все началось с того, что я задумал сделать новогоднее видео с Дедом Морозом (Санта Клаусом) для своей дочки, как он кладет подарки под елку.
• Сделайте страховку "на слуху" (Сбер, Альфа, Ингос и тд). Я делал как-то от Сбера. Оплата российской картой.
• Или оформите премиум страховку от Tripinsurance, она популярна у путешественников, так как самая надежная. Я покупал ее себе лично, но вы можете хотя бы ребенку ее сделать. Оплата любой картой. Скидка по ссылке 11%.
Кратко
- Для создания новогоднего видео нужен инструмент images2video, по отзывам это лучше всего делает Kling и Runaway.
- Референсы — это изображения, которые загружаются в нейросеть как исходный материал, на их основе ИИ создаёт видео.
- Чтобы без ВПН и с оплатой рублями можно использовать Syntx, нужна подписка Basic за 890 рублей, при ее оплате начисляется 260 токенов.
- Из 8 генераций у меня получилось 4 удачных варианта видео, надо изначально рассчитывать на 2-5 генераций.
- 5 секунд достаточно, но лучше 10 секунд, чтобы модель все успела сделать в видео, 5 секунд генерится минут 5-10, а 10 секунд 10-20 минут.
- На фотке референсе не должно попадать ничего в кадр что можно додумать, как можно меньше действий и предметов надо хотеть на видео.
- Лучше снизить ожидания, получится не совсем так как хотелось бы, главное реалистичность для ребенка.
Как сделать новогоднее видео с помощью ИИ
Вам нужно оживление картинки (фото референсы), то есть инструмент images2video. И потом эту фотку скормить нейросети. По отзывам это лучше всего делает Kling 2.6 и Kling O1. Причем, нейросеть (Perplexity) советует мне именно O1 (типа лучше с референсами работает), но мне по факту больше понравился 2.6.
Референсы — это изображения, которые вы загружаете в нейросеть как исходный материал. На их основе ИИ создаёт видео: «оживляет» фото, добавляет движение, анимирует персонажей или генерирует переходы между кадрами. По сути, это визуальная отправная точка, от которой нейросеть отталкивается при генерации.
Естественно, фотка-референс тоже должна быть вертикальной для вертикального видео.
Посредники есть разные, Kling можно юзать и напрямую. Чтобы без ВПН и с оплатой рублями, я традиционно использую Syntx, я про него уже писал. Это агрегатор нейросетей.
Там есть разные тарифы подписки, которые дают доступ к разному набору нейросетей. Одни тарифы с безлимитом, другие с ИИ за токены (которые не сгорают, но без подписки не действуют). Нам нужна подписка Basic за 890 рублей. При ее оплате вам начисляется 260 токенов, этого хватит на генерации.
Варианты удачного видео
На видео только удачные генерации. Вы можете использовать мой промт для своих генераций. Если надо простое видео, то используйте Стандартный Kling 2.1 и промт надо тогда упростить. Если использовать мой промт слово в слово, то лучше Профессиональный Kling 2.6.
4 нормальных из 9 получилось у меня, на мой взгляд.
Все без аудио:
На всякий случай чуть обрезал картинку-референс, чтобы без куска стула было. С такой картинкой совсем неудачная генерация получилась, в видео ее нет.
- Заменил в промте «colourful wrapped gifts» на «green wrapped boxes (gifts)», которые у нас есть.
- Режим профессиональный, Kling o1, 9:16, 10 сек, 45 токенов
- Уточнил промт, не просто «boxes», а «medium boxes». Из промта убрал magical snowflakes. Снежинки какие-то ненастоящие. Откуда они в квартире. Добавил исчезновение Дед Мороза (не было изначально в промте) «and disappears (dissolves into thin air)», он ведь волшебник. Написал «hidden static camera» вместо «smooth camera right pan». Попробуй потом объясни ребенку двигающуюся камеру.
- Несет один подарок (так выглядит), а кладет два. Непорядок! Добавил «and carries 2 green wrapped medium boxes (gifts)». Зачем-то в конце смотрит в скрытую камеру. Не особо важно, он же волшебник, мог знать, но убрал «warm smiles», возможно из-за этого.
- Исчезает в конце странно. Добавил «magically».
- Теперь попробуем самый дешевый вариант с тем же промтом.
- Теперь чуть подправил промт. Добавил «not through furniture» для исправления ситуации с диваном (но я не уверен что исправит, проще диван на референсе убрать) и «gently slowly» вместо просто «gently», чтобы как бы усилить.
- Снова дорогой O1 с этим подправленым промтом.
Режим стандартный, Kling 2.6, 5 сек, 14 токенов
Не понравилось, как Дед Мороз швыряет подарки, хотя в промте написано «gently». Но в целом уже норм. Можно брать (2я генерация).
Как-то нереально выглядит то, что делает Kling O1, не объяснить ребенку. Дед Мороз мультяшный и накуренный. Плюс коробки очень большие, у нас таких больших нет.
Режим профессиональный, Kling 2.6, 10 сек, 42 токена.
• Гайд по Таиланду - как поехать самостоятельно, составляю уже 15 лет.
• Авто-подбор пляжа/курорта - 1-4 вопроса, чтобы подобрать пляж и курорт. Все объехал.
Меня уже устраивает, особенно если начало видео обрезать. или затемнить, где можно подумать, что один подарок несет вместо двух. Это 3-я генерация, как и говорил. Однако пробуем дальше.
Режим профессиональный, Kling 2.6, 10 сек, 42 токена.
Теперь вообще идет с дивана, но хоть прогинает его. И это на четвертой генерации. До этого так не было.
Режим профессиональный, Kling 2.6, 10 сек, 42 токена.
Еще хуже в плане дивана. Идет прям из него, как будто его нет. Но все остальное круто (как надо). Если начало с диваном обрезать (это легко прям в телефоне сделать), то все нормально, я бы выбрал эту версию (5 генерация). Но сделаю еще три для поста.
Режим стандартный, Kling 2.1, 10 сек, 12 токенов. Если 5 сек делать, то вообще 6 токенов.
Видео попроще получилось: нет исчезновения, нет зажигающихся огней на елке. Дед Мороз немного графический. Видимо не все инструкции выполняет. Но в принципе норм, если устраивает можно брать.
Режим стандартный, Kling 2.1, 10 сек, 12 токенов.
Примерно тоже самое. Мне кажется вообще не выполняет часть инструкций. Дед Мороз может и нормальный, но также не исчезает, идет от камеры, подарок один и большой.
Режим профессиональный, Kling O1, 10 сек, 9:16, 45 токенов.
Вообще все не так получилось: и вообще не идет Санта Клаус, и не исчезает потом… И сначала молодой, потом постарел, а руки всосались. Вообще не нравится мне О1, мультяшно рисует. Один из подарков стал золотым вместо зеленого.
Кароче нет смысла продолжать. Вариантов уже 3-4 подходящих есть.
Все генерации по порядку:
Инструкция
- Регистрируемся в Syntx.
- Выбираем Видео будущего/Kling. В настройках модели ставим Профессиональный Kling 2.6 (или Стандартный Kling 2.1, если надо меньше токенов и видео попроще). Выбираем 5-10 сек. Креативность 0.8.
- Указываем мой промт
Скорректированный мной
9:16 vertical realistic video: Santa Claus in classic red suit with white beard and sack walks from left to cozy living room Christmas tree from @Image1 and carries 2 green wrapped medium boxes (gifts), gently places these gifts under tree, magically disappears (dissolves into thin air), twinkling lights on tree, hidden static camera, high detail 1080p
Первоначальный промт был от ИИ: 9:16 vertical realistic video: Santa Claus in classic red suit with white beard and sack walks from right to cozy living room Christmas tree from @Image1, gently places 3 colorful wrapped gifts under tree, warm smile, twinkling lights on tree, magical snowflakes, smooth camera pan left, high detail 1080p
Наблюдения и советы
- На фотке референсе не должно попадать ничего в кадр, что можно додумать. На моей первой генерации (ее тут нет) хорошо было видно, как нейросеть додумала и дорисовала стол, он совсем не такой, не деревянный и другого цвета. А на моей фотке был кусок стула (раз есть стул, должен быть и стол).
- Надо изначально рассчитывать на 2-5 генераций. По любому что-то не учтете. Или модель сделает не так.
- Лучше снизить ожидания, получится не совсем так, как хотелось бы. Главное, мне кажется, реалистичность. Но реалистичность для ребенка, поэтому на некоторые огрехи можно забить, ребенок все равно не заметит.
- 5 секунд достаточно, но лучше 10 секунд, чтобы модель все успела сделать в видео. 5 секунд генерится минут 5-10, а 10 секунд генерится 10-20 минут.
- В настройках модели, если есть, надо обязательно указать горизонтальное или вертикальное видео, даже если в промте указано.
- Как можно меньше действий надо хотеть на видео, как можно меньше предметов. Чтобы меньше полета фантазии у модели было, меньше шансов сделать что-то не так.
- Если на видео что-то не так, то не факт, что при следующей генерации при том же промте, оно повторится. Я к тому, что уточнение промта не прям всегда нужно, но не значит что вообще не надо.
Куда потратить оставшиеся токены и подписку
Есть вероятность, что токены останутся. Можно сделать еще одно видео, например просто оживить старые фотки. Или сделать нужные изображения (потестить или поиграться), например, в Nano Banana.
Подписка действует месяц и в нее входят все платные версии текстовых нейросетей без токенов. Например, можно устроить брейшторм с ними. Мне вот очень надо бы поговорить с платным GPT и Grok.
Тревел-сервисов много, поэтому рекомендую только те, которыми пользуюсь часто сам.
• LocalRent - тот случай, когда русские сделали лучше всех. Это авто-брокер (аренда машин) c отличной техподдержкой (она на русском, как и сайт) и хорошими ценами.
• Trip - цены на отели часто ниже именно для Азии. Trip принимает МИР и Юнионпей.
• Aviasales - единственный независимый поисковик авиабилетов, который остался. Принимает российские карты. А вот Скайсканнер ушел.
