Главное:
- Генеральный директор Google DeepMind, Демис Хассабис, анонсировал объединение моделей ИИ Gemini и Veo.
- Модели предназначены для улучшения понимания физического мира через мультимодальные данные.
- Объединение позволит улучшить универсальность и способность моделей к генерации различных видов медиа.
Будущее ИИ: объединение технологий
В недавнем эпизоде подкаста Possible, проведенного Ридом Хоффманом, глава Google DeepMind, Демис Хассабис, озвучил громкое заявление: компания планирует объединить свои модели искусственного интеллекта Gemini и Veo. Это слияние нацелено на создание мультимодальной системы, которая сможет более эффективно анализировать и генерировать данные различных типов, включая текст, изображения и видео. Хассабис подчеркнул, что модель Gemini была разработана с идеей создания универсального помощника, способного эффективно взаимодействовать с пользователями в реальном мире.
Как показывают исследования, такие мультимодальные модели становятся трендом в индустрии искусственного интеллекта. Успешный подход к созданию единых систем, способных обрабатывать различные виды медиа, открывает новые горизонты для применения ИИ в повседневной жизни, образовании и бизнесе.
Данные: ключ к успеху
По мнению Хассабиса, основные обучающие данные для Veo поступают с платформы YouTube, которая предоставляет огромные объемы видеоконтента. Использование таких данных значительно повышает способность моделей к пониманию физического мира. Хассабис уточнил, что, просматривая большое количество видео, Veo 2 может формировать представления о реальности и о том, как различные элементы взаимодействуют между собой.
Это поднимает важные вопросы о конфиденциальности и авторских правах. Google ранее обновил свои условия предоставления услуг, чтобы использовать больше данных для обучения своих моделей ИИ. Интересно, что согласно исследованию, большинство пользователей (примерно 75%) хотят большего контроля над тем, как их данные используются для обучения ИИ.
Перспективы универсальных моделей
Модели, подобные Gemini и Veo, становятся основой для создания так называемых «универсальных» ИИ-систем. Они могут изучать и синтезировать звук, текст и изображения, что делает их более ощутимыми и полезными для пользователей. Конкуренция среди технологических гигантов также возрастает: например, Amazon планирует выпустить свою модель, которая, как ожидается, будет иметь схожие функции.
Таким образом, интеграция моделей Gemini и Veo от Google может стать важным этапом в развитии ИИ, способствуя созданию более адаптивных и мощных цифровых помощников. Это открывает перед нами множество новых возможностей: от улучшения образования до эффективного решения бизнес-задач, в то время как пользователи могут ожидать более высокую степень взаимодействия с технологиями.
Добавить комментарий