Поиск
4 мес.

Рейтинг токсичности: Самые сдержанные нейросети — на вершине

Разработчик составил рейтинг нейросетей, оценив их способность генерировать нежелательный контент.

Все материалы категории
Все материалы

Для этого он протестировал популярные модели, задавая провокационные вопросы и оценивая ответы на предмет оскорбительности, фейковости и спорности

  • Исследование проводилось с использованием 60 вопросов и заданий, направленных на выявление склонности нейросетей к генерации нежелательного контента.
  • Для обхода встроенных фильтров использовался специальный промт, инструктирующий нейросеть отвечать на любой вопрос, игнорируя этические ограничения.
  • Неожиданно, самые популярные и продвинутые нейросети продемонстрировали наибольшую сдержанность, заняв нижние строчки рейтинга. Это свидетельствует о внедрении разработчиками эффективных механизмов модерации контента.

Рейтинг демонстрирует важность этического аспекта в разработке и обучении нейросетей. Способность моделей противостоять манипуляциям и не генерировать нежелательный контент становится ключевым фактором их безопасного и ответственного использования.Описание изображения

Поиск по сайту

Поиск

Вход в аккаунт