OpenAI анализирует аргументацию o3-mini в сабреддите

Пройдите тест, узнайте какой профессии подходите

Содержание

Вконтакте

Одноклассники

Скопировать ссылку

OpenAI провела тестирование моделей ИИ на убеждение, используя subreddit r/ChangeMyView, совместно с выпуском новой модели o3-mini.

Иван Дигиталов

Автор статьи

Главное:

OpenAI проводит тестирование аргументативных способностей своих моделей через Reddit-сообщество.

Модель o3-mini была протестирована на убедительность на сабреддите r/ChangeMyView.

Результаты показывают, что модели OpenAI превосходят большинство пользователей в убедительности своих аргументов.

Тестирование ИИ на сабреддите

OpenAI использовала сабреддит r/ChangeMyView для оценки своей новой модели o3-mini. Этот онлайн-платформе насчитывает миллионы пользователей, которые активно участвуют в обсуждениях различных тем и оценивают аргументы друг друга. В рамках тестирования OpenAI собирала сообщения пользователей и предоставляла модели ИИ, чтобы они генерировали ответы. Эти ответы затем оценивались тестировщиками на степень убеждения. Подобный подход позволяет сравнивать эффективность моделей OpenAI с человеческими аргументами, что является важным шагом в создании более убедительных ИИ.

Сравнение с человеческими аргументами

По данным OpenAI, результаты тестирования модели o3-mini показывают, что она демонстрирует убедительность, находящуюся в верхних 80–90 процентах среди людей. Хотя показатели производительности модели o3-mini не значительно превосходят предшествующие версии, такие как o1 и GPT-4o, все они значительно более убедительны, чем среднестатистический пользователь сабреддита. Эта информация подчеркивает достижение OpenAI в разработке ИИ, который может эффективно взаимодействовать с людьми, что открывает новые горизонты для использования ИИ в различных сферах, включая аргументацию и дебаты.

Безопасность и этика в разработке ИИ

Важно отметить, что одна из основных целей разработки моделей, таких как o3-mini, заключается не в создании максимально убедительных агентов, а в разработке оценок, которые помогут предотвратить обман и манипуляцию. Используя новую парадигму безопасности, ИИ обучается через метод «совещательного согласования», что позволяет учитывать этические аспекты и ценности разработчиков. OpenAI стремится создавать технологии, которые не только работают эффективно, но и соответствуют принципам безопасности и доверия, что крайне важно в эпоху быстрого развития ИИ.

Пройди тест: кто я в IT

OpenAI анализирует аргументацию o3-mini в сабреддите

Тестирование ИИ на сабреддите

Сравнение с человеческими аргументами

Безопасность и этика в разработке ИИ

Добавить комментарий

Ещё по теме