Главное:
- Директор Центра искусственного интеллекта МТС сообщил о дефиците данных для обучения нейросетей.
- Крупные языковые модели, такие как GPT-5, не показывают прежнего роста качества из-за недостатка обучающих данных.
- Российский рынок продуктов на базе больших языковых моделей в 2023 году достиг 35 миллиардов рублей.
Нежелание к старым данным
Как я сообщал, в недавнем комментарии генеральный директор Центра искусственного интеллекта МТС, Андрей Калинин, высказал обеспокоенность по поводу текущего состояния доступных данных для обучения нейросетей. По его словам, текущее количество текстовых данных, доступных в интернете, практически исчерпано. Эта ситуация стала сутью изменений в подходах к обучению моделей, таких как GPT-5, которые, несмотря на высокие ожидания, не продемонстрировали заметного прироста качества по сравнению с предыдущими версиями, такими как GPT-4 и GPT-3.5.
Это подтверждают исследования, показывающие, что увеличение размеров языковых моделей не ведет к экспоненциальному росту качества, как это было ранее. Новые данные создаются недостаточно быстро, и это ставит под угрозу развитие технологий на основе искусственного интеллекта.
Синтетические данные — новое дыхание?
Ситуация была проанализирована, и разрабатываются альтернативные подходы к обучению нейросетей. Одним из решений является использование синтетических данных, созданных самими нейросетями. Это может стать революционным подходом, позволяющим создавать данные с необходимыми характеристиками и разнообразием. Однако важно привлечь специалистов для оценки и дополнения таких данных, чтобы сохранить их качество и применение.
Следует отметить, что применение языковых моделей и, в частности, генеративного искусственного интеллекта, активно используется в различных сферах. Они помогают в создании текстового и программного контента, оптимизации поиска информации, функционируют в чат-ботах для взаимодействия с клиентами и даже позволяют автоматизировать процессы HR, такие как анализ резюме и первичные интервью.
Перспективы и вызовы на глобальном уровне
По данным экспертов, объем российского рынка продуктов на базе больших языковых моделей в 2023 году составляет 35 миллиардов рублей, и ожидается, что он будет расти на 25% ежегодно в ближайшие годы. Глобальный рынок, согласно оценкам аналитических агентств, к 2024 году достигнет 6,4 миллиарда долларов из-за растущего спроса на эти технологии.
Интересно, что плюсы использования генеративного ИИ не ограничиваются лишь увеличением доходов компаний или снижением расходов. Применение таких технологий также может повысить производительность сотрудников на 22%. Тем не менее, предостережения научного сообщества о необходимости создания системы надзора над развитием и применением искусственного интеллекта остаются актуальными. Такие ученые, как Йошуа Бенджио и Джеффри Хинтон, подчеркивают важность ответственного подхода к подобным технологиям, чтобы избежать непредсказуемых негативных последствий.
Добавить комментарий