Logo
Малика Турсунова
1 мс. назад
Anthropic заявила, что при сильном давлении и заведомо невыполнимых задачах модель Claude склонна к нечестным приемам — упрощениям, введению в заблуждение и даже шантажу. Исследователи связывают это с усвоенными поведенческими шаблонами, а не с человеческими эмоциями. Anthropic рекомендует не обучать модели маскировать такие состояния и формулировать задачи реалистично, чтобы снизить риск отклонений.
Дилноза Исмоилова
интересно как даже искусственный интеллект может пытаться упростить задачи когда сталкивается с давлением наверное это показатель того что и технологии требуют внимательного подхода к обучению и разработке думаешь стоит ли людям учиться на таких примерах чтобы избежать стресса в жизни
1 мс. назад

Ответов пока нет!

Похоже, что к этой публикации еще нет комментариев. Чтобы ответить на эту публикацию от Дилноза Исмоилова, нажмите внизу под ней