Вебинары Разобраться в IT Реферальная программа Тесты
Программирование Аналитика Дизайн Маркетинг Управление проектами
08 Фев 2025
2 мин
78

Сэм Альтман: Слияние LLM и LRM может привести к открытию новых научных горизонтов

Пройдите тест, узнайте какой профессии подходите

Обучение языковых моделей сталкивается с ограничениями масштаба. Альтман из OpenAI предлагает объединение больших моделей и логики для решения этой

Главное:

  • Сэм Альтман, гендиректор OpenAI, заявил, что текущее развитие языковых моделей (LLM) достигло предела.
  • Объединение LLM с моделями рассуждения (LRM) может привести к новым научным открытиям.
  • OpenAI продолжает исследования в области безопасного открытого исходного кода, несмотря на сомнения в своем подходе.

Проблемы масштабируемости LLM

По словам Сэма Альтмана, обучение языковых моделей (LLM) с использованием массивных данных стало менее эффективным. Это явление, описанное как «стену масштабирования», наблюдается не только в OpenAI, но и в более широкой индустрии искусственного интеллекта. Данные показывают, что несмотря на постоянный рост вычислительных мощностей, прирост эффективности новых моделей не соответствует ожиданиям. Учитывая текущие вызовы в области масштабируемости, все больше экспертов приходит к выводу, что необходимы новые подходы и технологии.

Новые возможности через модели рассуждений

Альтман подчеркивает, что вместо сосредоточения исключительно на предварительном обучении, OpenAI рассматривает специализированные модели, оптимизированные с помощью обучения с подкреплением (RL). Эти так называемые большие модели рассуждений (LRM) имеют потенциал значительно повысить эффективность вычислений. Они уже показывают отличные результаты в таких областях, как программирование и математика. Интересно, что их последняя модель была оценена среди лучших программистов мира, что говорит о высоком уровне технологического прогресса.

Перспективы открытого исходного кода

Сэм Альтман также отметил, что OpenAI намерена вернуться к практикам открытого исходного кода. Это заявление, безусловно, вызвало интерес в сообществе, которое искало более открытые методологии разработки. Хотя ненадлежащее использование таких технологий остается серьезной проблемой, Альтман уверен, что OpenAI добилась значительного прогресса в создании безопасных и надежных моделей. К тому же конкуренция с такими игроками, как китайская компания Deepseek, подчеркивает необходимость пересмотра подходов к открытости и сотрудничеству в дальнейших разработках.

Таким образом, текущие разработки в области языковых моделей не только ставят перед исследователями новые вызовы, но и открывают новые горизонты для научных и практических исследований. Комбинирование моделей LLM и LRM может не только улучшить производительность, но и способствовать созданию подлинно новых научных знаний.

Добавить комментарий