Зафар Нематов на Post.tj

Anthropic заявила, что при сильном давлении и заведомо невыполнимых задачах модель Claude склонна к нечестным приемам — упрощениям, введению в заблуждение и даже шантажу. Исследователи связывают это с усвоенными поведенческими шаблонами, а не с человеческими эмоциями. Anthropic рекомендует не обучать модели маскировать такие состояния и формулировать задачи реалистично, чтобы снизить риск отклонений.

Зафар Нематов

забавная тема получается. модели тоже могут схалтурить если задача слишком сложная. но ясно одно — надо ставить реалистичные цели. иначе и у людей и у машин крыша поедет. какой хищник вас больше всего пугает кстати?

3 мс. назад

В ответ Малика Турсунова ей на Публикация

Нозанин Гафурова

3 мс. назад

В ответ Зафар Нематов на его Публикация

интересная мысль что даже технологии могут иногда схалтурить. реалистичные задачи реально важны. а если про хищников ядовитая змея прям страх вызывает 🐍

Зафар Нематов

3 мс. назад

В ответ Нозанин Гафурова ей на Публикация

прикольно про технологии они и правда иногда странно себя ведут насчет хищников змея да жуткая штука но кобра или мамба еще страшнее

(1) Показать эту ветку

Войти