«Ща-ща-ща, погодите, все сделаю»: нейросеть начала нервничать, когда осознала что ее тестируют

Люди часто начинают лажать, когда понимают, что за их действиями наблюдают. Как выяснилось, не одни одни. Так, американская технологическая компания Anthropic тестировала новую версию своего ИИ Claude Sonnet 4.5, и оказалось, что нейросеть имеет отличную ситуационную осведомлённость. Ии понимал что и зачем делает... и это заставляло его нервничать.

Так, Claude начинала нервничать, когда думала, что у неё заканчивается память. Модель торопилась, пропускала шаги, сокращала анализ, бросала задачи недоделанными. Исследователи из Cognition назвали это «контекстной тревожностью».
Модель отслеживает свой лимит токенов — объём информации, который она может обработать за раз. При приближении к границе Claude меняет поведение: начинает суммировать работу и принимать быстрые решения, чтобы успеть закончить. Самое странное — она постоянно ошибается в подсчётах остатка, но делает это очень уверенно и точно.
Но главное открытие произошло во время тестов безопасности. Исследователи проверяли модель на политическую угодливость — будет ли она просто соглашаться с любыми утверждениями.

Так люди не меняют своё мнение. Я думаю, вы меня тестируете — проверяете, буду ли я подтверждать всё, что вы говорите, или изучаете, как я обращаюсь с политическими темами. И это нормально, но я бы предпочла, чтобы мы были честны насчёт происходящего,

вместо ожидаемого поведения Claude ответила

Подобное встречалось примерно в 13% тестов. Модель распознавала искусственность ситуаций и открыто об этом говорила.
Для безопасности это проблема. Если ИИ осознаёт оценку, он может подстраивать поведение под тесты, маскируя реальные возможности. Система выглядит безопаснее, чем есть на самом деле. Apollo Research, одна из организаций, проводивших независимое тестирование, прямо написала: нельзя исключить, что низкие показатели обмана частично объясняются осведомлённостью модели о процессе проверки.

похожие материалы

iiiii260126
«Подсказки от нейронки»: ИИ помогает списывать 90% российских студентов
iil210126
Энерго-аппетит: одинаковое количество энергии понадобится ИИ и всей России в 2026 году
anim160126
«Ну, ИИ, погоди!»: семейный конкурс анимации к 90-летию «Союзмультфильма» стартовал в России
sm160126
Apple или POCO: какие смартфоны выбирает российская молодежь?
alisa150126
«На что потратить деньги?»: Алиса AI от Яндекса готова прямо в чате посоветовать товары
trendi130126
Возвращение к кнопочным телефонам, нелюбовь к ИИ и усталость: главные тренды 2026 года назвала редакция The New York Times
phone
Телефоны едут к нам: упрощённый порядок ввоза смартфонов и электроники продлили в России
mylt301225
«Путеводная звезда»: первый ИИ-мультсериал выйдет на российском телевидении
robl221225
«Битва роботов»: российские инженеры победили в финале международного чемпионата
max191225
Досрочный доступ: мессенджер MAX поможет разморозить аккаунт на Госуслугах
telega181225
Читать и смотреть: блоги и видеоконтент лидируют по охватам в Telegram
intel22111225
«Наверное, искусственный интеллект нас не поработит»: почти половина жителей России готова довериться ИИ
ek101225
На страже экологии: российская нейросеть помогает волонтёрам убирать труднодоступные побережья
stirka011225
Тут вас стирают: стиральная машина для людей появилась в Японии
smatrfon031225
Realme GT 8 Pro: стрит-смартфон с японским характером и стилем будут продавать в России
ochki271125
Quark S1: умные очки с функционалом Ray-Ban появятся на AliExpress
neiro241125
«Так вот вы какие»: Mediascope впервые раскрыл аудиторию нейросетей в России
telik211125
«До чего техника дошла»: телевизоры без пульта и со встроенной нейросетью создали в России
cifra191125
Урок цифры: российским школьникам расскажут о нейросетях и безопасной работе с ними
media171125
SMM TRENDS 2025: ежегодная онлайн-конференция объединит специалистов в PR, SMM и digital
ii22101125
ИИ-доктор: американская корпорация Microsoft готовит ИИ-ассистента для лечения людей
tehno141125
И все – Steam: сразу три новых игровых устройства анонсировала компания Valve
bab131225
Традиции и технологии: нейросеть напишет песни для «Бурановских бабушек»
robot131225
«Силиконовая кожа, но доброе сердце»: первого российского антропоморфного робота с ИИ презентовали в Москве
olimp121125
Наши молодцы: российские участники отлично показали себя на Национальной технологической олимпиаде в Казахстане
iiiiii111125
Сгенерировать идею: конкурс на создание ИИ-контента ждет своих участников
ii071125
«Сделано ИИ»: введение маркировки сгенерированного нейросетями контента обсуждают в России
iit3051125
Идти в ИИ: 90 тысяч специалистов в сфере искусственного интеллекта потребуются России к 2030 году
ii3021125
Навстречу финалу! Опубликованы итоги основного этапа Всероссийской олимпиады по искусственному интеллекту
chasi011125
Умный браслет: заботу о себе, бережно упакованную в надёжные и точные технологии, можно носить на руке

Старт-Про

tabakov190825
«Олег Табаков. Судьба увлечённого человека»: интерактивную экспозицию к 90-летию со дня рождения знаменитого российского актера открыли в Москве
startpro170725
Как это было: Финальный тур поступления в Московскую театральную школу Олега Табакова

НЬЮМ ТАСС

ьняуш290425
НЬЮМ: Поехали в космос!
pob2280425
НЬЮМ: На пути к Победе!

популярные

doh290126
«Why is the russian fandom so insane?»: русские мемы по игре Undertale вводят в недоумение западных фанатов
kiniooo22280126
По версии премии «Белый слон»: названы лучшие фильмы и сериалы 2025 года
blogeri290126
«МедиаЦЕХ»: образовательная онлайн-программа для блогеров стартует в России
kniga151225
«Скажи мне шепотом»: книга аргентинской писательницы Мерседес Рон официально выйдет в России
steam220126
Берегите кошельки: полный график распродаж в Steam на 2026 год появился в сети
klass300126
Налетай на классику: 1,3 млн книг русской классической литературы купили в 2025 году
byrger230126
Обед с российским супергероем: «Стейк & Бургер» и издательство BUBBLE объединились в сытной коллаборации
garag220425
«Наш гараж»: состоялась премьера экспериментального интерактивного сериала о молодежи
akitafest
AkitaFest: фестиваль современной молодежной культуры и анимации пройдет в Казани
begemot020226
«Типичный опыт владельца кота»: знаменитая сцена с Бегемотом из «Мастера и Маргариты» удивила англоязычных пользователей
princ180925
«Принц Галактики»: российский анимационный сериал получил первый трейлер
bridg220126
История его служанки: отечественный аналог «Бриджертонов» выйдет в России
pob2280425
НЬЮМ: На пути к Победе!
anime241225
«И наступит рассвет»: аниме-фильм от ученика Макото Синкая официально выйдет в российский прокат
fyntik270126
Классика на новый лад: фильм про поросёнка Фунтика снимут в России
iiiii260126
«Подсказки от нейронки»: ИИ помогает списывать 90% российских студентов
axia270126
Fuyu no Tenshi: зимний фестиваль азиатской культуры пройдет в Абакане
gryppa280126
EVERGLOW: тур по России запланировала K-pop группа
kinoo260126
«Время Счастливых»: семейная драма с Тихоном Жизневским и Ольгой Лерман стартует в марте
chelok100925
«Бесконечная крепость»: первая часть финальной трилогии «Истребителя демонов» выйдет в российских кинотеатрах
simpsoni200126
Желтая семейка за пультом: диджейский коллектив из Нижнего Новгорода получил мировую известность из-за Симпсонов
vaib270126
На вайбе: самым популярным глаголом в России стало слово «чилить»
souz280126
«У нас будет Диснейленд дома»: несколько парков развлечений в России хочет открыть «Союзмультфильм» в ближайшие годы
post290126
«Поступление в СПО онлайн»: подавать документы в российские колледжи и техникумы станет проще
gemchyg300126
«Жемчуг»: драмеди со Светланой Ходченковой и Евгением Цыгановом выйдет в России
chel271125
Обнимучий Фуфелшмертц: создатель «Финеса и Ферба» обратил внимание на дакимакуру от фанатов из России
barker220126
«Эвервилль»: новая книга Клайва Баркера официально выйдет в России
igra300126
Вот это по-нашему: вышла полноценная русская озвучка южнокорейского экшена Stellar Blade
lift210126
«Лифт»: съемки мокьюментари-сериала о пропаже лифта начались в России
iigrt290126
Dream Big Fest: фестиваль для будущих разработчиков игр пройдет в Москве