NVIDIA представила VideoLDM — нейросеть для создания видео по описанию
Аудио-версия:
Комментарии

NVIDIA представила технологию VideoLDM — нейросеть, которая умеет создавать небольшие ролики на основе текста. Сейчас ИИ способен генерировать видео длительностью до пяти секунд в разрешении 2048х1280 пикселей и с частотой 24 кадра в секунду.

Нейросеть способна создавать ролики как из простых описаний («Кот спит»), так и из сложных («Астронавт стоит в озере, полном уток, и наблюдает за ними»). Как заявляют в NVIDIA, алгоритм учитывает около 4,1 млрд различных параметров, больше половины которых он «извлёк» из других видео.

Ознакомиться с примерами работ VideoLDM можно на сайте NVIDIA.

Сейчас VideoLDM тестируют внутри NVIDIA. В компании отмечают, что добились заметных успехов по качеству видео относительно текстового запроса всего за месяц. Когда именно нейросетью смогут воспользоваться все желающие, неизвестно.

Комментарии