Вебинары Разобраться в IT Реферальная программа
Программирование Аналитика Дизайн Маркетинг Управление проектами
12 Янв 2025
3 мин
1

Ученые представили Sky-T1 — ИИ-модель с «рассуждающими» способностями.

Команда из Калифорнийского университета выпустила Sky-T1-32B, первую открытую AI-модель рассуждения, конкурентоспособную с аналогами.

Главное:

  • Команда NovaSky из Калифорнийского университета представила модель AI Sky-T1 с возможностями рассуждения.
  • Стоимость обучения модели составила менее $450, что является значительным снижением по сравнению с предыдущими разработками.
  • Sky-T1 демонстрирует конкурентоспособные результаты, особенно в математических задачах, по сравнению с ранними версиями модели o1 от OpenAI.

Инновационная модель Sky-T1

Недавно команда NovaSky из лаборатории Sky Computing Lab в Беркли анонсировала запуск новой модели искусственного интеллекта — Sky-T1-32B-Preview, которая способна к рассуждениям. Эта модель выделяется тем, что она действительно открыта для воспроизведения другими исследователями. В отличие от многих существующих моделей, обучение Sky-T1 было осуществлено при помощи доступного набора данных и кода, что вдохновляет разработчиков и исследователей на дальнейшие эксперименты.

Модель была обучена менее чем за $450. Это впечатляющий результат, особенно в контексте того, что расходы на обучение сопоставимых моделей ранее исчислялись миллионами долларов. Использование синтетических данных, сгенерированных другими AI, стало ключевым фактором в достижении такой низкой стоимости. Это открывает новые горизонты для стартапов и небольших компаний, которые ранее не могли позволить себе инвестиции в разработку ИИ.

Преимущества рассуждающих моделей

Модели с возможностями рассуждения, такие как Sky-T1, имеют значительные преимущества по сравнению с типичными AI. Они способны самостоятельно проверять факты, что минимизирует вероятность распространения ошибок и неточностей в выводах. Хотя такие модели требуют чуть больше времени на решение задач по сравнению с стандартными нейросетями, их надежность делает их особенно полезными в таких областях, как наука и математика.

Команда NovaSky отмечает, что в тестах на математические задачи, таких как MATH500, Sky-T1 показала лучшие результаты, чем ранние версии o1. Это подтверждает, что возможны эффективно работающие модели с более высоким уровнем точности и контроля. Кроме того, использование других моделей, таких как QwQ-32B-Preview от Alibaba и GPT-4o-mini от OpenAI для курирования обучающих данных, хвалит интеграцию технологий и подходов в предоставлении мощных решений.

Будущее открытых моделей

Команда NovaSky уже заявила о намерениях продолжить работу над улучшением модели Sky-T1 и разработкой более эффективных решений в будущем. Эта работа включает в себя эксперименты с новыми методами, направленными на улучшение точности и скорости выполнения задач. Открытость исследований и доступность кода действительно могут создать новый стандарт в области искусственного интеллекта и вдохновить новое поколение разработчиков.

Кроме того, на горизонте уже обозначаются новые версии моделей, такие как o3 от OpenAI, которые поднимают планку еще выше. Это создает здоровую конкурентную среду, которая, в свою очередь, может ускорить процесс инноваций в сфере AI. Следует ожидать, что такие разработки, как Sky-T1, будут способствовать дополнительному повышению интереса к открытым ресурсам и исследовательским инициативам в области науки и технологий.

Добавить комментарий