Kling дропнул Avatar 2.0 — собрал самое важное, что нужно знать.
1. Лучше держит портретное сходство. Модель точнее удерживает лицо, мимику и пропорции. Меньше «плывущих» черт и случайных искажений.
2. Липсинк и микромимика. Губы совпадают с аудио гораздо точнее — без отставаний и «склеек». Добавлены естественные микродвижения лица, глаз и головы, за счёт чего аватар выглядит заметно живее.
3. Увеличили длину роликов до 5 минут. Модель стабильно держит лицо, стиль и эмоции на всём протяжении. Подходит для клипов, обзоров, рекламы и любых форматов «говорящая голова». В ранних версиях на таких промежутках всё разваливалось.
4. Гибкость на вход. Работает из одного фото + аудио (речь или пение). Через промт можно задавать эмоции, интонацию и стиль анимации. Может восстанавливать лицо даже с неидеальных и плохо освещённых референсов.
5. Качество изображения и FPS. Качество на выходе: 1080p, 30–48 FPS. Плавнее анимация, лучше сохраняются черты лица, меньше артефактов на коже и волосах.
6. Две модели на выбор. Standard экономит кредиты. Pro даёт больше детализации и стабильности, но не «в два раза лучше» — имеет смысл, когда нужна максимальная чистота и консистентность лица.
7. Добавили интеграцию с ElevenLabs для подключения своих голосов.
Цены: можно тестить, дают 66 кредитов в день (не более 166 в месяц), этого хватает на небольшие тесты. Минимальный тариф Standard — $6.99/мес: 660 кредитов, 1080p, до 30 сек, без водяного знака. Расход — около 100 кредитов за 5 секунд премиум-видео. 90 секунд стоят примерно $30.
Пример прикрепил, что думаете?
Данный пост имеет прикрепленный видео-контент. Для ознакомления с содержимым видео — необходимо перейти на источник по ссылке ниже.