Вебинары Разобраться в IT Реферальная программа Тесты
Программирование Аналитика Дизайн Маркетинг Управление проектами
30 Янв 2025
2 мин
4

Новая ИИ-модель Alibaba обошла DeepSeek-V3 по всем показателям

Alibaba представила языковую модель Qwen2.5-Max, использующую более 20 триллионов токенов для обучения.

Главное:

  • Alibaba представила новую языковую модель Qwen2.5-Max, обученную на рекордных 20 триллионах токенов.
  • Модель превосходит по производительности такие лидирующие AI как Deepseek-V3 и GPT-4o.
  • Qwen2.5-Max доступна через API Alibaba Cloud, однако не будет выпущена с открытым исходным кодом.

Рекордные объемы данных

Компания Alibaba продолжает активно развивать свои технологии искусственного интеллекта, представив новую языковую модель Qwen2.5-Max. Эта модель является частью семьи Qwen2.5 и удивляет рекордным объемом обучающих данных — более 20 триллионов токенов. Для сравнения, многие конкуренты, такие как Deepseek-V3 и Llama-3.1-405B, использовали около 15 триллионов токенов. Стоит отметить, что объем данных не всегда является решающим фактором для производительности. Например, исследования показывают, что вычислительная мощность во время тестирования также играет ключевую роль в эффективности языковых моделей.

Сравнение с конкурентами

Qwen2.5-Max показала выдающиеся результаты в нескольких тестах, включая Arena-Hard и LiveBench, что позволяет говорить о ее высокой конкурентоспособности. Важно подчеркнуть, что модели, такие как GPT-4o и Claude 3.5 Sonnet, имеют свои сильные стороны, и прямое сопоставление их возможностей с Qwen2.5-Max не всегда очевидно. В условиях быстро развивающегося рынка AI понимание того, что делает модель успешной, требует комплексного анализа, включая изучение алгоритмов, архитектуры и методов обучения.

Доступность и ограничения

Несмотря на потенциал Qwen2.5-Max, модель будет доступна исключительно через API Alibaba Cloud. Это решение открывает возможности для разработчиков, однако отсутствие открытого исходного кода может ограничить доступность для широкого круга пользователей. Кроме того, важно учитывать, что модель будет работать под контролем китайских государственных ограничений на контент, что также является значимым фактором для многих потенциальных пользователей. С учетом всех этих нюансов, Qwen2.5-Max станет интересным инструментом для бизнес-приложений, но её применение может быть ограничено в контексте международного рынка.

Таким образом, запуск Qwen2.5-Max является значимым событием в мире искусственного интеллекта, которое подчеркивает стремление Alibaba занять лидирующие позиции в данной области. Мы должны ожидать дальнейших разработок и нововведений в формировании будущего AI.

Добавить комментарий