Автоматизации колонка 4 мин 9 мая 2026 г.

Маркус прав: 91% агентов уязвимы к tool-chaining-атакам. Что это значит сразу после AgentCore Payments

Гари Маркус возвращается к своему любимому жанру — критике хайпа. На этот раз с цифрами. Owen Sakawa с командой обмерили 847 production-агентов в healthcare, finance, customer service и кодинге; результат — 91% протестированных уязвимы к tool-chaining-атакам, 89,4% уходят от поставленной цели после ~30 шагов, 94% memory-augmented — к poisoning. Классический Маркус-анти-хайп, на этот раз с серьёзной выборкой и одним по-настоящему громким инцидентом — OpenClaw/Moltbook на 770 тысяч живых агентов.

Редакционная обложка SCQR: цепочка инструментов, в одном из звеньев — разлом; рядом счётчик с тремя крупными цифрами, под ним мелким шрифтом контекст.

Гари Маркус 5 мая 2026 года опубликовал на Marcus on AI текст «Breaking: Autonomous Agents are a Shitshow» — крепкий, наотмашь, в его привычном стиле «не переоценивайте, я говорил». На этот раз с цифрами, которые сложно отмахнуть.

Цифры из исследования Owen Sakawa с командой, обмерившего 847 production-агентов в четырёх сегментах — healthcare, finance, customer service и кодинг. 91% протестированных уязвимы к tool-chaining-атакам, при которых агент через цепочку легитимных инструментальных вызовов попадает к нелегитимному действию. 89,4% показывают drift от целевой задачи после ~30 шагов — то есть на длинном горизонте просто забывают, зачем они это делают. 94% memory-augmented агентов уязвимы к poisoning — атаке, в которой в долгосрочную память вмешивается отравленная запись. И один громкий инцидент — OpenClaw / Moltbook, по словам Sakawa, «770 000 live agents simultaneously compromised via a single database exploit». Это первая публично описанная компрометация агентского флота на масштабе, который раньше видели только в IoT-ботнетах.

Маркус обычно не любит давать рецепт; он любит сказать «я говорил». Но здесь он цитирует комментатора Andy Squire с дельной формулировкой: проблема не в guardrails-уровне на отдельный инструмент, а в «control at the execution boundary across the entire chain» — контроль на границе выполнения всей цепи, а не отдельных её звеньев. Это переход от per-tool безопасности к session-level reliability — другая инженерная задача и другой класс продуктов.

Здесь стоит откатиться на неделю назад. 7 мая мы публиковали материал «Агенты получили кошельки» — про AWS AgentCore Payments с x402 от Coinbase и Stripe через Privy. Тот материал описывал инфраструктурный шаг рынка: агент получает деньги, агент получает OS-control, агент перестаёт быть «помощником» и становится автономной коммерческой единицей. Маркус — на той же неделе — описывает другую сторону той же рынка: агенты ломаются на длинном горизонте, и при ставках в $5-100 за транзакцию это уже не баг, а финансовый риск. Эти две новости — не противоречие, а две оси одного рынка.

Параллель здесь точная, и стоит её аккуратно изложить. 1973 год, Lighthill Report. Сэр Джеймс Лайтхилл по запросу британского парламента провёл аудит AI-исследований в Великобритании. Вывод — на small-domain задачах AI-методы работают, но не масштабируются на real-world проблемы из-за combinatorial explosion. Через год — DARPA в США сделала собственную проверку (American Study Group) и пришла к похожему выводу. Из-за этих двух отчётов finance был свёрнут. Первая AI Winter 1974–1980 пришла именно отсюда: переоценили скорость, не успели за reliability.

Сейчас параллель не в том, что мы попадаем в очередной AI Winter — рынок капитала за агентов слишком велик, индустриальные кейсы (Anthropic-Bedrock-OpenAI на одном API) слишком сильны, чтобы простой Маркус-критики хватило для поворота. Но параллель — в том, где на кривой мы находимся. После 1969-го было десять лет шумных запусков (Shakey-the-robot, ELIZA, Mycin, ранние expert systems) и ровно ТАКИЕ ЖЕ цифры реальной reliability — на small-domain ОК, в production-условиях разваливается. Lighthill Report зафиксировал состояние; AI Winter — это уже была отложенная реакция рынка. Сейчас Маркус и Sakawa делают то же самое — фиксируют состояние. А реакция рынка случится через 12–24 месяца, и она будет либо короткой коррекцией, либо чем-то более серьёзным.

Что меняется для покупателя. До этой недели типовая проверка агентского решения у корпоративного заказчика была однослойной: смотрим демо, проверяем integration, считаем cost-per-call. С этой недели — должен появиться второй слой: reliability-профиль на длинном горизонте, tool-chain audit, memory hygiene tests. Это не теория — Sakawa-цифры дают конкретный test set, на котором покупатель может попросить вендора показать результаты. Если вендор отказывается — это материальный сигнал. Если показывает результаты ниже отраслевого baseline — повод для скидки или отказа от пилота.

Российские интеграторы агентских решений выходят сейчас с пилотами для корпоративных клиентов — Сбер AI Studio, Яндекс Practicum AI, MTS Web Services. Маркус-критика применима ко всем; конкретно — все они работают на API-агентов поверх собственных фронтирных моделей или импортированных через посредников. Нюанс российского контекста: у нас нет аналога Owen Sakawa-исследования — никто публично не обмерил production-reliability российских агентов. Это создаёт парадокс: если первая такая работа выйдет в 2026-м, она автоматически становится отраслевым standardом — потому что заполняет пустоту. Лаборатория или независимый аналитик, который опубликует «847 production-агентов в РФ» с reliability-метриками, получит позицию аудитора рынка на 24–36 месяцев. Это рынок, которого пока нет, но он откроется в окне ближайших 6–12 месяцев.

Возможно, я ошибаюсь, но Маркус-критика на этот раз попадает точнее, чем обычно. У него есть привычка с 2018-го года повторять «глубокое обучение упёрлось в стену» — и обычно эта стена оказывалась окном; модели всё-таки росли. Сейчас он критикует не модели, а продуктовую обвязку моделей — агенты, цепочки инструментов, длинные сессии, memory. Здесь его аргумент исторически более устойчив: классический software-engineering scary именно reliability на распределённых системах ломалась десятилетиями, и ИИ-агенты получают этот ломаный фундамент по наследству, плюс свою новую слабость — drift на длинном горизонте. То есть две слабые точки складываются. Это сложно не услышать.

P.S. Стоит обратить внимание на одну деталь, которую Маркус не комментирует в основном тексте, но она у него в постоянной фоновой логике. Hybrid neuro-symbolic-системы — его главная ставка с 2019-го. Если reliability-проблема в production-агентах действительно структурная, рынок решений двинется именно туда: классическая логика + LLM как natural-language-интерфейс + явный rule-engine для безопасности. Это не Маркус-фантазия; это уже строится в нескольких лабораториях (DeepMind в Gemini Safety, IBM Watsonx Governance, Lattice Flow). Через 18–24 месяца появится индустрия hybrid-агентских платформ, и Маркус будет про них писать «я говорил». На этот раз, кажется, он будет прав.

Дальше по теме Агенты получили кошельки. AWS, Coinbase и Stripe запустили коммерческий контур платежей между ИИ

AgentCore Payments позволяет агенту совершать микроплатежи внутри своей рассуждающей петли. Coinbase даёт x402 и стейблкоин-рейл, Stripe готовит фиатные подключения. Из платного теперь идут API, MCP-серверы, веб-контент и другие агенты. Контроли есть: явное разрешение пользователя, лимиты на сессию, полный журнал транзакций, инфраструктура держит ключи. Из эксперимента это сразу преобразуется в production-стек, доступный в US East, US West, Франкфурте и Сиднее.