Главное:
- OpenAI проводит тестирование аргументативных способностей своих моделей через Reddit-сообщество.
- Модель o3-mini была протестирована на убедительность на сабреддите r/ChangeMyView.
- Результаты показывают, что модели OpenAI превосходят большинство пользователей в убедительности своих аргументов.
Тестирование ИИ на сабреддите
OpenAI использовала сабреддит r/ChangeMyView для оценки своей новой модели o3-mini. Этот онлайн-платформе насчитывает миллионы пользователей, которые активно участвуют в обсуждениях различных тем и оценивают аргументы друг друга. В рамках тестирования OpenAI собирала сообщения пользователей и предоставляла модели ИИ, чтобы они генерировали ответы. Эти ответы затем оценивались тестировщиками на степень убеждения. Подобный подход позволяет сравнивать эффективность моделей OpenAI с человеческими аргументами, что является важным шагом в создании более убедительных ИИ.
Сравнение с человеческими аргументами
По данным OpenAI, результаты тестирования модели o3-mini показывают, что она демонстрирует убедительность, находящуюся в верхних 80–90 процентах среди людей. Хотя показатели производительности модели o3-mini не значительно превосходят предшествующие версии, такие как o1 и GPT-4o, все они значительно более убедительны, чем среднестатистический пользователь сабреддита. Эта информация подчеркивает достижение OpenAI в разработке ИИ, который может эффективно взаимодействовать с людьми, что открывает новые горизонты для использования ИИ в различных сферах, включая аргументацию и дебаты.
Безопасность и этика в разработке ИИ
Важно отметить, что одна из основных целей разработки моделей, таких как o3-mini, заключается не в создании максимально убедительных агентов, а в разработке оценок, которые помогут предотвратить обман и манипуляцию. Используя новую парадигму безопасности, ИИ обучается через метод «совещательного согласования», что позволяет учитывать этические аспекты и ценности разработчиков. OpenAI стремится создавать технологии, которые не только работают эффективно, но и соответствуют принципам безопасности и доверия, что крайне важно в эпоху быстрого развития ИИ.
Добавить комментарий