Главное:
- Исследователи из Стэнфорда и Вашингтонского университета разработали модель ИИ s1 за менее чем 50 долларов.
- Модель s1 демонстрирует аналогичные математические и кодирующие способности, что и более дорогие модели, такие как o1 от OpenAI.
- Обучение s1 заняло менее 30 минут с использованием вычислительных ресурсов на 20 долларов.
Что представляет собой модель s1?
Исследователи из Стэнфорда и Вашингтонского университета разработали новую модель искусственного интеллекта, получившую название s1. Этот проект стал возможен благодаря дистилляции — процессу, который позволяет извлечь «логические» способности из уже существующих моделей. Для обучения s1 была использована минимальная база данных, состоящая всего из 1000 вопросов и их ответов, что позволило сократить затраты на облачные вычисления до менее чем 50 долларов. Важно отметить, что в мире, где затраты на обучение крупных моделей ИИ могут достигать миллионов долларов, такой подход сделает технологии доступнее для широкой аудитории.
Параметры и возможности s1
Модель s1 показывает впечатляющие результаты в тестах на математические и кодирующие способности, сопоставимые с теми, что демонстрируют разработанные крупными лабораториями, такими как OpenAI и DeepSeek. В течение обучения, которое длилось менее 30 минут на 16 графических процессорах Nvidia H100, было выявлено, что s1 способна продлить время обработки ответов. Исследователи добавили команду «подождать», что дало модели возможность генерировать более точные ответы. Это говорит о том, что контрольный механизм размышлений может существенно улучшить качество выводов, создаваемых искусственным интеллектом.
Будущее и конкуренция в сфере ИИ
С запуском такой доступной модели конкуренция в области искусственного интеллекта неуклонно возрастает. Крупные компании, включая Meta, Google и Microsoft, продолжают наращивать инвестиции в эту область, что также способствует расширению границ возможностей для инноваций. При этом важно учитывать, что хотя дистилляция позволяет создать доступные альтернативы, она не заменяет необходимость разработки совершенно новых моделей. Исследователи полагают, что успех s1 может спровоцировать интенсивные разработки и в дальнейшем привести к созданию новых, более мощных алгоритмов, которые будут доступны даже для малых компаний и индивидуальных разработчиков.
Таким образом, с появлением модели s1 открываются новые горизонты для разработчиков и исследователей в сфере ИИ, а доступные технологии могут оказать значительное влияние на будущее этой области.
Добавить комментарий