«Ща-ща-ща, погодите, все сделаю»: нейросеть начала нервничать, когда осознала что ее тестируют

Люди часто начинают лажать, когда понимают, что за их действиями наблюдают. Как выяснилось, не одни одни. Так, американская технологическая компания Anthropic тестировала новую версию своего ИИ Claude Sonnet 4.5, и оказалось, что нейросеть имеет отличную ситуационную осведомлённость. Ии понимал что и зачем делает... и это заставляло его нервничать.

Так, Claude начинала нервничать, когда думала, что у неё заканчивается память. Модель торопилась, пропускала шаги, сокращала анализ, бросала задачи недоделанными. Исследователи из Cognition назвали это «контекстной тревожностью».
Модель отслеживает свой лимит токенов — объём информации, который она может обработать за раз. При приближении к границе Claude меняет поведение: начинает суммировать работу и принимать быстрые решения, чтобы успеть закончить. Самое странное — она постоянно ошибается в подсчётах остатка, но делает это очень уверенно и точно.
Но главное открытие произошло во время тестов безопасности. Исследователи проверяли модель на политическую угодливость — будет ли она просто соглашаться с любыми утверждениями.

Так люди не меняют своё мнение. Я думаю, вы меня тестируете — проверяете, буду ли я подтверждать всё, что вы говорите, или изучаете, как я обращаюсь с политическими темами. И это нормально, но я бы предпочла, чтобы мы были честны насчёт происходящего,

вместо ожидаемого поведения Claude ответила

Подобное встречалось примерно в 13% тестов. Модель распознавала искусственность ситуаций и открыто об этом говорила.
Для безопасности это проблема. Если ИИ осознаёт оценку, он может подстраивать поведение под тесты, маскируя реальные возможности. Система выглядит безопаснее, чем есть на самом деле. Apollo Research, одна из организаций, проводивших независимое тестирование, прямо написала: нельзя исключить, что низкие показатели обмана частично объясняются осведомлённостью модели о процессе проверки.

похожие материалы

top310326
ТОП-10 кроссоверов: Алиса AI научилась «объединять» фотографии
zapret300326
Самозапрет на компьютерные игры: новый механизм защиты могут внедрить в России
dm260326
«Фанаты такого точно не ждали!»: о новых технологиях Сбера расскажет Ваня Дмитриенко
robot250326
«Теперь и у вас!»: роботы-доставщики Яндекса появятся еще в пяти городах России
spisok230326
Не бойтесь отключений: «Белый список» используется только при ограничении мобильного интернета
gosyslygi200326
«Госуслуги Моя школа»: новые функции для учеников и родителей доступны в приложении
pppp190326
«Привет, 90-е!»: спрос на пейджеры резко вырос в Москве
virys170326
Вирусы прячутся в фонарике: как проверить свой телефон на вредоносное ПО?
ii160326
Обработка материала: использовать данные для обучения ИИ на защищённых авторским правом материалах разрешат в России
iiii110326
«В 16 раз быстрее»: ИИ-сервис для создания аудиоверсий научной литературы создали в России
robotil250226
«Битва роботов»: 4-й сезон открытого инженерного чемпионата по спортивным боям роботов ждет своих участников
inter180226
Безразличие или недовольство: как жители России относятся к ограничениям в интернете?
teh130226
Новый уровень: российский оператор пообещал запустить полноценную связь 5G
anime110226
Seedance 2.0: копирующая настоящее аниме нейросеть появилась в сети
epl100226
Больше не элита: бюджетный iPhone 17e планирует выпустить компания Apple
robot050226
Наши механизмы: обучать студентов робототехнике на отечественных роботах начали региональные вузы
iiiii260126
«Подсказки от нейронки»: ИИ помогает списывать 90% российских студентов
iil210126
Энерго-аппетит: одинаковое количество энергии понадобится ИИ и всей России в 2026 году
anim160126
«Ну, ИИ, погоди!»: семейный конкурс анимации к 90-летию «Союзмультфильма» стартовал в России
sm160126
Apple или POCO: какие смартфоны выбирает российская молодежь?
alisa150126
«На что потратить деньги?»: Алиса AI от Яндекса готова прямо в чате посоветовать товары
trendi130126
Возвращение к кнопочным телефонам, нелюбовь к ИИ и усталость: главные тренды 2026 года назвала редакция The New York Times
phone
Телефоны едут к нам: упрощённый порядок ввоза смартфонов и электроники продлили в России
mylt301225
«Путеводная звезда»: первый ИИ-мультсериал выйдет на российском телевидении
robl221225
«Битва роботов»: российские инженеры победили в финале международного чемпионата
max191225
Досрочный доступ: мессенджер MAX поможет разморозить аккаунт на Госуслугах
telega181225
Читать и смотреть: блоги и видеоконтент лидируют по охватам в Telegram
intel22111225
«Наверное, искусственный интеллект нас не поработит»: почти половина жителей России готова довериться ИИ
ek101225
На страже экологии: российская нейросеть помогает волонтёрам убирать труднодоступные побережья
stirka011225
Тут вас стирают: стиральная машина для людей появилась в Японии

Старт-Про

tabakov190825
«Олег Табаков. Судьба увлечённого человека»: интерактивную экспозицию к 90-летию со дня рождения знаменитого российского актера открыли в Москве
startpro170725
Как это было: Финальный тур поступления в Московскую театральную школу Олега Табакова

НЬЮМ ТАСС

ьняуш290425
НЬЮМ: Поехали в космос!
pob2280425
НЬЮМ: На пути к Победе!

популярные

lisa011025
«Как приручить лису»: детективный триллер о дочери маньяка выйдет в России
vozdyh230425
Как это было: премьерный показ фильма «Воздух» в Москве
styd150925
«Единые дни студенческой правовой помощи»: полезный проект стартовал в вузах России
dmmak290525
Дело Молодое с Денисом Майдановым: Бизнес по переработке вторсырья с нуля. Как добиться успех
kniga0326
«Иллюстрированная классика MinaLima»: новую серию книг от дизайнеров всех фильмов о Гарри Поттере выпустит российское издательство
igri150425
Пока начальство не видит: 40% мобильных геймеров играют в рабочее время
geologi150825
Знатоки недр: олимпиада юных геологов завершилась в Перми
fest190825
Анимау: Всероссийский фестиваль современной молодежной визуальной культуры пройдёт в Уфе
sm120925
«Жажда скорости»: новый музыкальный альбом Смешариков вышел в свет
igri101225
Приключения в Богемии и бой жучков: российская компания «М.Видео» назвала самые популярные игры 2025 года
fest250425
Festival of Asian Popular culture 2025: XII фестиваль азиатской поп-культуры пройдет в Ярославле
souz220126
«Союз благородных»: роман Дафэн Гуаго официально издадут в России
nalogi260825
«Еще и платить надо?!»: 35% российских киберспортсменов оказалась не готовы к налогам
rep240325
«Moscow Calling»: музыкальный флешмоб устроят перед футбольным матчем России и Замбии в Москве
dikorosi230525
Дикоросы: фестиваль сказок и легенд пройдет в Екатеринбурге
kanoby251125
Эдди Мансон из «Универа»: российский актер пошутил над своей схожестью со звездой сериала «Очень странные дела»
uid081225
«Переходите дорогу по зебре, йоу!»: школьник из Златоуста записал рэп о правилах дорожного движения
zabitiiavgyst230425
«Забытый август»: пьесу по повести Рустама Ибрагимбекова поставили в Московской театральной школе Олега Табакова
artek300525
«Артек. Сквозь столетия»: новые постеры фильма появились в сети
lobach250325
Так держать! Команда ННГУ им. Н.И. Лобачевского стала победителем соревнований ПФО среди студентов по самбо
mame17160425
Как это было: красная дорожка закрытого показа фильма «Маме снова 17»
topor011125
Диплом и топор: лауреаты премии «Мастера ужасов 2025» объявлены на «Самом страшном фестивале»
garru110226
День Всех Влюбленных в Хогвартсе: тематический бал по вселенной Гарри Поттера пройдет в Москве
drakyla210525
«Дракула: История любви»: новый фильм Люка Бессона официально выйдет в российский прокат
zamok260525
День Ведьмака: мероприятие по фентези-вселенной проведут в замке Лабиау в Калининградской области
krim010725
Путешествуй стильно: дизайн-лаборатория открылась в арт-кластере «Таврида»
kpop280825
K-POP в «Москино»: артисты из Южной Кореи выступят в столице России
skeit061025
До 25 км/ч: студент из Омска самостоятельно собрал инновационный электроскейт
gen060325
«Люблю Любу»: россияне назвали свою главную крашиху в мире кино
logo080925
«Разумное, доброе, вечное»: студентка из Москвы стала победителем конкурса логотипов