Вебинары Разобраться в IT Реферальная программа Тесты
Программирование Аналитика Дизайн Маркетинг Управление проектами
31 Янв 2025
2 мин

США обошли Китай в области AI: новая сиэтлская модель обходит DeepSeek V3.

В Сиэтле представлена новая модель искусственного интеллекта от Ai2, которая, по заявлениям разработчиков, превосходит DeepSeek V3.

Главное:

  • Сиэтл стал домом для новой модели AI – Tulu3-405B, которая превосходит DeepSeek V3 и GPT-4o.
  • Модель разработана исследовательским институтом Ai2 и имеет открытый исходный код.
  • Tulu3-405B содержит 405 миллиардов параметров и обучалась на 256 графических процессорах.

Прорыв в области искусственного интеллекта

Недавно в Сиэтле было представлено новое поколение искусственного интеллекта – модель Tulu3-405B от Ai2. Она не только превзошла китайскую разработку DeepSeek V3, но и обошла GPT-4o от OpenAI в ряде тестов, что, безусловно, подчеркивает растущую конкурентоспособность США на международной арене AI. Открытый исходный код Tulu3-405B создает дополнительные возможности для исследователей и разработчиков, поскольку они могут изучать и адаптировать эту модель в своих проектах без дополнительной финансовой нагрузки.

Согласно отчетам Ai2, их новая модель содержит 405 миллиардов параметров, что значительно больше, чем у многих существующих аналогов. Это количество параметров важно, так как, как правило, более крупные модели способны более эффективно решать сложные задачи и предоставлять более качественные ответы.

Технология обучения и ее особенности

Ключевым аспектом работы Tulu3-405B является метод обучения, известный как обучение с подкреплением с проверяемыми вознаграждениями (RLVR). Этот метод позволяет модели развивать навыки в выполнении заданий с конкретными результатами, такими как решение математических задач и выполнение различных инструкций. Ai2 использовал 256 графических процессоров для обучения, что свидетельствует о сложности и ресурсоемкости данной реализации.

Результаты тестирования показывают, что Tulu3-405B выдерживает жесткую конкуренцию, участвуя в таких бенчмарках, как PopQA и GSM8K. На последнем Tulu3-405B продемонстрировала отличные результаты, выделяясь среди других моделей благодаря своей способности справляться с заданиями, требующими математических знаний.

Будущее открытого AI

С выходом Tulu3-405B, Ai2 подчеркивает важность открытого исходного кода в развитии искусственного интеллекта. Открытые модели AI, как правило, способствуют более быстрому и эффективному развитию технологий, так как больший круг исследователей и разработчиков может внести свой вклад в их улучшение.

Представители Ai2 отмечают, что это не просто шаг вперед для их института, но и важная веха для будущего AI в США. Открытый AI привлекает внимание благодаря своей доступности и возможности сотрудничества между различными игроками в этой области. Это может стать отправной точкой для новых находок и прорывов, что уже делает Tulu3-405B мощным инструментом для развития отрасли.

Добавить комментарий