Главное:
- Genmo анонсировала открытие модели Mochi 1 для генерации видео на основе текстовых запросов.
- Mochi 1 станет конкурирующим продуктом для существующих решений, таких как Runway и Luma AI.
- Модель доступна под лицензией Apache 2.0 и предлагает бесплатные возможности генерации видео.
- Правительство компании Genmo привлекло $28.4 миллиона для дальнейших исследований и разработок в области видео-технологий.
Суть модели Mochi 1 и её особенности
Компания Genmo, фокусирующаяся на генеративных видео-технологиях, представила свою новейшую модель Mochi 1. Данная модель является первой с открытым исходным кодом, что позволяет разработчикам интегрировать её в свои проекты без финансовых затрат. Genmo делает ставку на демократизацию технологий, предлагая пользователям возможность создавать высококачественные видео по текстовым запросам. В отличие от других коммерческих решений, которые требуют подписки (например, Hailuo Unlimited за $94,99 в месяц), Mochi 1 предоставляет мощные возможности для создания видео совершенно бесплатно.
На начальном этапе доступно разрешение 480p, и версия HD запланирована на более поздний срок. При тестировании модель продемонстрировала высокую степень понимания пользовательских запросов и корректное воспроизведение движений объектов и персонажей.
Технические характеристики и инновации Mochi 1
Новые технологии, использованные в создании Mochi 1, включают архитектуру Asymmetric Diffusion Transformer (AsymmDiT) с 10 миллиардами параметров. Это делает Mochi 1 крупнейшей открытой моделью для генерации видео на сегодняшний день. Также в ней применяются продвинутые компрессионные алгоритмы, такие как Variational Autoencoder (VAE), которые уменьшают объем данных и делают модель доступной для использования на пользовательских устройствах.
Стоит отметить, что хотя модель уже показывает хорошие результаты, пользователи всё же могут столкнуться с небольшими искажениями в сложных движениях, что остается зоной для улучшений в будущих версиях.
Перспективы использования видео-генерации и развитие компании Genmo
С выходом Mochi 1, Genmo открывает широкие возможности для различных отраслей — от развлечений до образования. Соучредитель компании, Парас Джайн, подчеркивает важность доступности технологий и считает, что генерация видео сможет значительно улучшить симуляторы для автономных систем и роботов.
Недавний раунд финансирования в размере $28.4 миллиона поддержит дальнейшие исследования в области видео-генерации. Это, безусловно, указывает на высокий потенциальный интерес к технологиям, которые могут преобразовать сами основы производства контента. В конечном итоге, открытие Mochi 1 может способствовать значительным изменениям в том, как мы создаем и взаимодействуем с видео-контентом.
Добавить комментарий