«Ща-ща-ща, погодите, все сделаю»: нейросеть начала нервничать, когда осознала что ее тестируют

Люди часто начинают лажать, когда понимают, что за их действиями наблюдают. Как выяснилось, не одни одни. Так, американская технологическая компания Anthropic тестировала новую версию своего ИИ Claude Sonnet 4.5, и оказалось, что нейросеть имеет отличную ситуационную осведомлённость. Ии понимал что и зачем делает... и это заставляло его нервничать.

Так, Claude начинала нервничать, когда думала, что у неё заканчивается память. Модель торопилась, пропускала шаги, сокращала анализ, бросала задачи недоделанными. Исследователи из Cognition назвали это «контекстной тревожностью».
Модель отслеживает свой лимит токенов — объём информации, который она может обработать за раз. При приближении к границе Claude меняет поведение: начинает суммировать работу и принимать быстрые решения, чтобы успеть закончить. Самое странное — она постоянно ошибается в подсчётах остатка, но делает это очень уверенно и точно.
Но главное открытие произошло во время тестов безопасности. Исследователи проверяли модель на политическую угодливость — будет ли она просто соглашаться с любыми утверждениями.

Так люди не меняют своё мнение. Я думаю, вы меня тестируете — проверяете, буду ли я подтверждать всё, что вы говорите, или изучаете, как я обращаюсь с политическими темами. И это нормально, но я бы предпочла, чтобы мы были честны насчёт происходящего,

вместо ожидаемого поведения Claude ответила

Подобное встречалось примерно в 13% тестов. Модель распознавала искусственность ситуаций и открыто об этом говорила.
Для безопасности это проблема. Если ИИ осознаёт оценку, он может подстраивать поведение под тесты, маскируя реальные возможности. Система выглядит безопаснее, чем есть на самом деле. Apollo Research, одна из организаций, проводивших независимое тестирование, прямо написала: нельзя исключить, что низкие показатели обмана частично объясняются осведомлённостью модели о процессе проверки.

похожие материалы

top310326
ТОП-10 кроссоверов: Алиса AI научилась «объединять» фотографии
zapret300326
Самозапрет на компьютерные игры: новый механизм защиты могут внедрить в России
dm260326
«Фанаты такого точно не ждали!»: о новых технологиях Сбера расскажет Ваня Дмитриенко
robot250326
«Теперь и у вас!»: роботы-доставщики Яндекса появятся еще в пяти городах России
spisok230326
Не бойтесь отключений: «Белый список» используется только при ограничении мобильного интернета
gosyslygi200326
«Госуслуги Моя школа»: новые функции для учеников и родителей доступны в приложении
pppp190326
«Привет, 90-е!»: спрос на пейджеры резко вырос в Москве
virys170326
Вирусы прячутся в фонарике: как проверить свой телефон на вредоносное ПО?
ii160326
Обработка материала: использовать данные для обучения ИИ на защищённых авторским правом материалах разрешат в России
iiii110326
«В 16 раз быстрее»: ИИ-сервис для создания аудиоверсий научной литературы создали в России
robotil250226
«Битва роботов»: 4-й сезон открытого инженерного чемпионата по спортивным боям роботов ждет своих участников
inter180226
Безразличие или недовольство: как жители России относятся к ограничениям в интернете?
teh130226
Новый уровень: российский оператор пообещал запустить полноценную связь 5G
anime110226
Seedance 2.0: копирующая настоящее аниме нейросеть появилась в сети
epl100226
Больше не элита: бюджетный iPhone 17e планирует выпустить компания Apple
robot050226
Наши механизмы: обучать студентов робототехнике на отечественных роботах начали региональные вузы
iiiii260126
«Подсказки от нейронки»: ИИ помогает списывать 90% российских студентов
iil210126
Энерго-аппетит: одинаковое количество энергии понадобится ИИ и всей России в 2026 году
anim160126
«Ну, ИИ, погоди!»: семейный конкурс анимации к 90-летию «Союзмультфильма» стартовал в России
sm160126
Apple или POCO: какие смартфоны выбирает российская молодежь?
alisa150126
«На что потратить деньги?»: Алиса AI от Яндекса готова прямо в чате посоветовать товары
trendi130126
Возвращение к кнопочным телефонам, нелюбовь к ИИ и усталость: главные тренды 2026 года назвала редакция The New York Times
phone
Телефоны едут к нам: упрощённый порядок ввоза смартфонов и электроники продлили в России
mylt301225
«Путеводная звезда»: первый ИИ-мультсериал выйдет на российском телевидении
robl221225
«Битва роботов»: российские инженеры победили в финале международного чемпионата
max191225
Досрочный доступ: мессенджер MAX поможет разморозить аккаунт на Госуслугах
telega181225
Читать и смотреть: блоги и видеоконтент лидируют по охватам в Telegram
intel22111225
«Наверное, искусственный интеллект нас не поработит»: почти половина жителей России готова довериться ИИ
ek101225
На страже экологии: российская нейросеть помогает волонтёрам убирать труднодоступные побережья
stirka011225
Тут вас стирают: стиральная машина для людей появилась в Японии

Старт-Про

tabakov190825
«Олег Табаков. Судьба увлечённого человека»: интерактивную экспозицию к 90-летию со дня рождения знаменитого российского актера открыли в Москве
startpro170725
Как это было: Финальный тур поступления в Московскую театральную школу Олега Табакова

НЬЮМ ТАСС

ьняуш290425
НЬЮМ: Поехали в космос!
pob2280425
НЬЮМ: На пути к Победе!

популярные

anime060625
«Гачиакута»: аниме-сериал начнет выходить на Кинопоиске и «Иви» одновременно со стартом в Японии
myz311025
«Щелкунчик»: определены участники I тура XXVI Международного конкурса юных музыкантов
krivo040326
Wildberries х Krivokoso: российские бренды в коллаборации выпустили капсулу к 8 марта
kanoby170325
«День возвращения огня»: обновление для Genshin Impact обзавелось своим трейлером
ek101225
На страже экологии: российская нейросеть помогает волонтёрам убирать труднодоступные побережья
top130525
На трех консолях: ТОП-10 самых продаваемых игр составили в России
mol050625
Молодежное сотрудничество: открыт приём заявок на летнюю смену Международного клуба дружбы в Нижегородской области
dybai180325
Генконсульство России в Дубае пожаловалось на странные обращения сограждан с помощью мемного мультфильма «Настоящие охотники за привидениями»
rosmol190325
«Проводники смыслов»: открыта регистрация на конкурс для авторов экскурсионного контента
social240625
Жизнь в сети: сколько часов в день молодежь проводит в соцсетях и мессенджерах?
dav010426
«Давление»: военная драма с Бренданом Фрейзером и Эндрю Скоттом выйдет в российский прокат
lubimii220425
«Родные – Любимые»: открыт приём заявок на летние слёты для всей семьи
tofy030625
Дело Молодое с Денисом Майдановым. Тофу из Санкт-Петербурга
tel220925
РИФ – 2025: Российский интернет форум состоится в Москве
fest150126
EVENFEST: фестиваль по игре «Five Nights at Freddy's» пройдет в Москве
sreda220925
«Создавая будущее»: II Международный симпозиум объединит экспертов в Национальном центре «Россия»
igrii190126
Эксперты выясняли: во что играют российские геймеры?
befri240226
Graffiti Drop: российский бренд Befree выпустил лимитированную коллекцию в эстетике уличной моды
princessa300425
«Непобедимая принцесса»: комикс о житие святой Екатерины выпустили в России
segyn130525
«Сегун»: сериал о феодальной Японии был признан лучшим на церемонии BAFTA TV Awards
bishkekl100625
Гостеприимный Бишкек: школы города распахнули двери для участников фестиваля «Наристе»
lubov120226
Любовь витает в воздухе: россияне рассказали о своих чувствах в преддверии Дня всех влюбленных
rossia091025
«Мульти-Россия. Путешествия на поезде»: новые серии специального цикла вышли в России
omiks41125
«Агент Y2K»: комикс в духе 00-х выпустит российский автор
moda160425
Как это было: Весенняя Гравитация НА DMC MUSIC TV
chel271125
Обнимучий Фуфелшмертц: создатель «Финеса и Ферба» обратил внимание на дакимакуру от фанатов из России
nebo280126
«Черное небо»: дилогию китайской писательницы Му Сули издадут в России
gorod280225
Думерская эстетика: почему мы научились любить наши панельки и любоваться ими?
koshka110325
Отдых для старательной кошечки: Пульхра из игры Zenless Zone Zero получила личную ASMR-короткометражку
vedmak140325
Страсти по «Ведьмаку»: российские художники запустили флешмоб со стёбным перерисовыванием обложки «Перекрестка Воронов»