«Неподконтрольная речь человека»: какие угрозы представляют новые данные для искусственного интеллекта?

Пройдите тест, узнайте какой профессии подходите

Содержание

Вконтакте

Одноклассники

Скопировать ссылку

MLCommons и Hugging Face представили обширную коллекцию голосовых записей из общественного достояния для исследований в области AI.

Иван Дигиталов

Автор статьи

Главное:

MLCommons и Hugging Face представили масштабный набор данных «Неконтролируемая человеческая речь», содержащий более миллиона часов аудиозаписей на 89 языках.

Набор данных может привести к предвзятости в системах AI из-за преобладания английских записей с американским акцентом.

Существует риск использования голосов людей без их согласия в рамках коммерческих приложений AI.

Масштабность и цели нового набора данных

Недавно MLCommons, некоммерческая рабочая группа по безопасности AI, и платформа Hugging Face представили новый набор данных под названием «Неконтролируемая человеческая речь». Этот набор данных стал одним из крупнейших в мире и составил более миллиона часов голосовых записей. Проект направлен на поддержку исследований в области обработки голосовой информации, что, безусловно, является значительным шагом в том, чтобы сделать коммуникационные технологии более доступными для разных языков и диалектов. Он способен помочь улучшить технологии распознавания и синтеза речи, особенно на языках, ресурсы которых ограничены.

Однако, несмотря на амбициозные цели библиотекарей AI, возникает множество опасений. Исследования показывают, что такие наборы данных могут быть предвзятыми, что может негативно повлиять на эффективность моделей, обучающихся на таких данных.

Проблема предвзятости и этики

Главная проблема «Неконтролируемой человеческой речи» заключается в высоком проценте записей на английском языке, сделанных с американским акцентом. Согласно документации проекта, это может существенно повлиять на качество распознавания и синтеза речи для таких групп, как не носители языка или носители других акцентов и диалектов. Это подчеркивает важность тщательной проверки и корректировки голосовых моделей, чтобы избежать укоренения предвзятости в системах искусственного интеллекта.

Более того, сам факт использования голосов людей, которые не в курсе, что их записи были собраны для научных исследований, вызывает этические вопросы. Даже при наличии лицензий Creative Commons, не исключено, что могли быть допущены ошибки, и это требует тщательного анализа и мониторинга. Исследования подчеркивают, что во многих наборах данных для AI отсутствует ясная информация о лицензировании, что создает проблемы для соблюдения авторских прав.

Перспективы и будущее развития технологий AI

В то время как MLCommons обещает модернизировать и улучшать качество нового набора данных, разработчики и исследователи должны проявлять серьезную осторожность. Необходим отдельный анализ возможных последствий использования таких наборов данных на практике и их влияние на существующие системы AI.

Примечательно, что потенциал, который открывают новые технологии и подходы, требует от нас более осознанного и ответственного подхода. Недостаток прозрачности, а также сложные процессы отказа от использования данных создают серьезные этические и юридические вопросы. Тем не менее, правильно использованные технологии могут внести значительный вклад в развитие интернациональных коммуникаций и расширение возможностей для пользователей по всему миру.

Научное сообщество должно активно участвовать в обсуждении таких разработок, чтобы избежать нежелательных последствий и наладить честные и прозрачные процессы, способствующие поддержанию этических стандартов в быстро развивающейся области искусственного интеллекта.

Пройти тест: моя идеальная работа

«Неподконтрольная речь человека»: какие угрозы представляют новые данные для искусственного интеллекта?

Масштабность и цели нового набора данных

Проблема предвзятости и этики

Перспективы и будущее развития технологий AI

Добавить комментарий

Ещё по теме