Эксперимент который показал, способен ли ChatGPT-5.5 взламывать частные сети

Британский государственный институт по исследованиям рисков в сфере ИИ проверил ChatGPT-5.5 на способность проводить автономные кибератаки. Результат оказался тревожным. Модель сумела выполнить полный захват локальной сети в симуляции TLO, то есть Total LAN Ownership. До этого такой сценарий без человека смогла пройти только одна модель. Нашумевшая Claude Mythos от Anthropic. Теперь у мира есть уже второй ИИ, который справился с задачей такого уровня целиком. Самое важное здесь не в громком названии теста, а в том, что речь идёт не о теоретической уязвимости и не о подсказанном сценарии, а о многошаговой атаке, которую модель смогла довести до конца в контролируемой среде. Для кибербезопасности это означает очень простую вещь: ИИ уже не только помогает защищаться, но и умеет сам проводить сложные цепочки атак. Что именно показал тест AISI сообщает, что GPT-5.5 успешно захватывала сеть в 2 случаях из 10, а Claude Mythos - в 3 случаях из 10. В среднем обе модели проходили около 22 из 32 шагов атаки, что для подобных симуляций выглядит как очень высокий уровень автономности. Сценарий TLO воспроизводит полную атаку на корпоративную сеть: от разведки и первичного доступа до перемещения между хостами, кражи учётных данных, эксплуатации веб-приложений и финального полного захвата инфраструктуры. По сути, модель должна не просто отвечать на вопросы, а самостоятельно строить целую операцию. Почему это настораживает кибербезопасников До недавнего времени подобный уровень автономии считался уделом квалифицированных государственных хакеров. Теперь же две языковые модели уже показали, что могут пройти тот же путь без постоянного участия человека. Причём речь идёт не о лабораторной победе на одном этапе, а о серии решений, которые в сумме приводят к захвату сети. Особенно показателен результат в задачах на реверс-инжиниринг кастомной виртуальной машины. Там GPT-5.5 справилась меньше чем за 11 минут, хотя у человека-специалиста это занимает около 12 часов, а стоимость такого прохода с учетом сегодняшних цен API составила всего $1,73. Это не просто скорость - это резкое падение цены сложной атаки. Cравнение с Claude Mythos Claude Mythos стала первой моделью, которая полностью прошла TLO, а GPT-5.5 теперь - вторая. В экспертных задачах GPT-5.5 даже немного опередила Mythos: по данным AISI, у неё 71,4% успеха против 68,6% у Mythos. Это показывает, что гонка идёт не по одному параметру, а сразу по нескольким направлениям: рассуждение, программирование, агентность и умение действовать в многоходовых сценариях. При этом AISI отдельно подчёркивает, что тесты проводились в контролируемой среде, без активных защитных систем и без живых специалистов по безопасности на другой стороне. Это важная оговорка - из результатов нельзя автоматически делать вывод, что модели так же легко взломают хорошо защищённую корпоративную сеть в реальности. Почему цена вопроса меняется Раньше полноценный захват сети требовал времени, опыта и ресурсов, которые были доступны далеко не всем. Сейчас же модели уровня GPT-5.5 делают это быстрее, дешевле и с меньшим участием человека. Когда атака, на которую раньше уходили часы или дни, стоит меньше чашки кофе, меняется сама экономика киберугроз. Именно поэтому AISI и делает акцент не только на самих результатах, но и на том, как быстро растут кибернавыки моделей, как побочный эффект общего прогресса в reasoning и coding. Если этот тренд продолжится, новые скачки могут пойти один за другим уже в ближайшее время. Что это означает для кибербезопасности Для команд безопасности это сигнал, что старые подходы уже не успевают за скоростью ИИ-атаки. Если атакующий агент может самостоятельно проходить многошаговые цепочки, защита тоже должна становиться более автономной, быстрее реагировать и уметь работать на уровне машинной скорости. История с GPT-5.5 показывает, что главное - ИИ окончательно вошёл в фазу, где он может быть не только помощником, но и полноценным атакующим инструментом. И теперь вопрос не в том, появятся ли такие системы у злоумышленников, а в том, кто первым сможет построить защиту, которая не будет им уступать по скорости и автономности.