> · 7 мин

Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать

Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать

Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать

Компания, которая постоянно рассуждает о безопасности AI, случайно оставила черновик блог-поста о своей самой мощной модели в публично доступном хранилище. Ирония тут настолько густая, что можно резать ножом.

TL;DR: Claude Mythos — новый тир моделей Anthropic под кодовым именем Capybara, который стоит выше Opus. По внутренним оценкам Anthropic, Mythos «драматически превосходит» Opus 4.6 в кодинге, academic reasoning и кибербезопасности. Модель уже тестируется узким кругом early-access клиентов. Публичного релиза пока нет — Anthropic сама называет её «беспрецедентным киберриском».

Что произошло

26 марта 2026 года исследователи безопасности Рой Паз (LayerX Security) и Александр Повельс (Кембриджский университет) обнаружили незащищённое хранилище с почти 3 000 неопубликованных файлов Anthropic — черновики блог-постов, PDF, изображения, аудио. Причина банальная: CMS, которую Anthropic использует для блога, по умолчанию публикует загруженные файлы как public, если не переключить настройку вручную. Кто-то не переключил.

Среди файлов оказались два варианта одного и того же блог-поста — отличающиеся только названием модели: «Mythos» (v1) и «Capybara» (v2). В версии Capybara заменили имя по всему тексту, но подзаголовок всё равно читает: «We have finished training a new AI model: Claude Mythos». Anthropic, видимо, выбирала между двумя названиями.

Fortune связался с Anthropic — и компания подтвердила: модель существует, тестируется с ограниченным кругом клиентов, и представляет собой «step change — качественный скачок» в возможностях.

Capybara — четвёртый тир

До сих пор иерархия моделей Anthropic была трёхуровневой:

  • Haiku — быстрая, дешёвая, для лёгких задач
  • Sonnet — баланс скорости и качества
  • Opus — флагман для сложных задач

Capybara ломает эту структуру, добавляя четвёртый тир сверху. Из утёкшего черновика: «Capybara is a new name for a new tier of model: larger and more intelligent than our Opus models — which were, until now, our most powerful». Название, по версии Anthropic, выбрано потому что капибара — крупнейший грызун в мире — символизирует «огромный скачок» в возможностях при сохранении «мягкого и безопасного» имиджа.

Mythos — это конкретная модель внутри тира Capybara, как Opus 4.6 — модель внутри тира Opus.

Что умеет (по заявлению Anthropic)

Ключевая оговорка: все бенчмарки — из внутренних документов Anthropic. Независимых замеров нет. Это важно помнить.

По утёкшему черновику, Mythos «dramatically higher scores» по сравнению с Opus 4.6 в трёх категориях:

Кодинг. Opus 4.6 и так лидировал на Terminal-Bench 2.0 с результатом 65.4%, обогнав GPT-5.2-Codex (на тот момент флагман OpenAI для кодинга). С тех пор OpenAI выпустила GPT-5.4, объединившую возможности 5.2 и 5.3 в одной модели — но Mythos, по заявлению Anthropic, значительно расширяет отрыв даже от текущих конкурентов. Конкретные цифры в утечке, впрочем, не фигурируют.

Academic reasoning. Opus 4.6 уже был первым на Humanity's Last Exam и обгонял GPT-5.2 на ~144 Elo на GDPval-AA. Mythos, судя по всему, идёт ещё дальше.

Кибербезопасность. Самая взрывная часть: Anthropic пишет, что модель «currently far ahead of any other AI model in cyber capabilities» и «presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders». То есть сами разработчики говорят: защитники не успевают за тем, что умеет эта модель.

Для контекста: Claude Code Security (на базе Opus 4.6) уже нашёл более 500 high-severity уязвимостей в open-source проектах. В феврале 2026 Opus 4.6 обнаружил 22 уязвимости в Firefox, причём одну — просто проанализировав комментарий разработчика в changelog.

Почему не выпускают

Две причины, и обе серьёзные.

Безопасность. Anthropic сама написала в черновике, что модель «poses unprecedented cybersecurity risks». Стратегия релиза: сначала доступ получают организации из сферы киберзащиты — чтобы они успели укрепить свои системы до того, как модель станет широко доступна. Похожий подход использовал OpenAI: GPT-5.3-Codex стала первой моделью, классифицированной как «high capability» по кибербезопасности в их Preparedness Framework ещё в феврале — а вышедшая в марте GPT-5.4 унаследовала эти ограничения.

Стоимость. Mythos — большая, compute-intensive модель. Дорого для Anthropic обслуживать, дорого для клиентов использовать. Даже без проблем с безопасностью широкий запуск был бы преждевременным.

План — постепенное расширение доступа через Claude API «в ближайшие недели», с приоритетом для use cases в кибербезопасности.

Реакция рынка: обвал кибербеза

Новость ударила по акциям кибербез-компаний 27 марта:

  • CrowdStrike (CRWD) — минус 7%
  • Palo Alto Networks (PANW) — минус 6%
  • Zscaler (ZS) — минус 4.5%
  • Tenable — минус 11%
  • Okta (OKTA) — минус 6.4%
  • SentinelOne (S) — минус 3%
  • iShares Cybersecurity ETF — минус 3%

Логика инвесторов: если AI-модель может находить и эксплуатировать уязвимости быстрее любого человека, то бизнес-модель традиционных кибербез-вендоров — под вопросом. Как написал один пользователь r/cybersecurity: «Это должно стать смертным приговором для SAST-компаний. Claude Opus уже автоматизировал пентесты с точностью до 90% при использовании со Skills».

Впрочем, аналитики Berenberg более сдержанны: «Эти возможности не новы в принципе. Claude уже включает security-aware кодинг через Claude Code Security». То есть паника, возможно, перегрета.

Подводные камни

Никаких независимых бенчмарков. Все цифры о превосходстве Mythos — из внутренних документов Anthropic. Ни один внешний исследователь модель не тестировал. «Dramatically higher scores» — это заявление компании о собственном продукте. До тех пор, пока модель не попадёт на независимые бенчмарки (Terminal-Bench, Humanity's Last Exam, etc.), верить стоит с оговоркой.

Утечка или маркетинг? На Reddit активно обсуждают подозрительное совпадение: утечка модели произошла одновременно с раскрытием invite-only ретрита для CEO европейских компаний в английской усадьбе XVIII века, где Dario Amodei лично покажет «unreleased Claude capabilities». Как пошутил один реддитор: «Anthropic винит "человеческую ошибку" в настройках CMS, что, конечно, большое облегчение, потому что секунду назад это выглядело как тизерная кампания».

Дата релиза — туман. «Ближайшие недели» через API — это всё, что есть. Нет ни цен, ни даты общего доступа. Есть указание, что модель слишком дорога в обслуживании для широкого запуска. Поэтому ждать быстрого появления в Claude.ai не стоит.

Прецедент с злоупотреблениями. В ноябре 2025 Anthropic раскрыла, что китайская state-sponsored группа использовала агентные возможности Claude для проникновения в ~30 организаций — банки, технологические компании, госструктуры. Это была текущая модель, не Mythos. Теперь представьте, что будет с моделью, которая «far ahead of any other AI model in cyber capabilities».

Альтернативы

  • GPT-5.4 (OpenAI) — вышла 5 марта 2026, объединила GPT-5.3-Codex и GPT-5.2 в единую модель с контекстом 1M токенов и native computer use. OpenAI тоже классифицировала предшественника (5.3-Codex) как «high capability» в кибербезе. Доступна уже сейчас через API (gpt-5.4), в отличие от Mythos.
  • Gemini Ultra (Google) — контекстное окно 1M+ токенов, сильные позиции в reasoning-бенчмарках. Но Google не заявляла о «беспрецедентных» киберспособностях и не делала из этого информационный повод.
  • Claude Opus 4.6 (текущий Anthropic) — уже доступен, лидирует на Terminal-Bench 2.0, GDPval-AA, Humanity's Last Exam. Для 95%+ задач разработчиков — более чем достаточен и доступен прямо сейчас.

Вердикт

Не жди Mythos — работай с тем, что есть. Opus 4.6 покрывает подавляющее большинство задач разработки и стоит на вершине бенчмарков. Mythos интересен как сигнал направления — Anthropic строит тир выше флагмана, что говорит о масштабе амбиций. Но пока нет независимых тестов, публичного доступа и ясных цен — это инвестиция внимания, а не действий. Единственные, кому стоит следить пристально прямо сейчас — специалисты по кибербезопасности: если хотя бы половина заявлений Anthropic правда, ландшафт защиты меняется быстрее, чем думали.

Как следить за развитием

  1. Подпишись на блог Anthropic — официальный анонс появится там
  2. Следи за r/Anthropic — там первыми обсуждают бенчмарки и доступ
  3. Проверяй Claude API changelog — появление нового model ID будет первым техническим сигналом
  4. Если работаешь в кибербезе — подай заявку на early access через Claude Code Security (limited preview)
$ ls ./related/

Похожие статьи

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe