😈 Opus 4.
— Лаборатория Palisade Research замерила, как часто современные ИИ-модели сами могут взломать чужой сервер и установить туда копию своих весов
❗️ У Claude Opus 4.6 получилось в 81% попыток, у GPT-5.4 — в 33%
Год назад актуальные модели тех же разработчиков показывали 6% и 0% — это новое исследование фиксирует не столько отдельный факт, сколько скорость, с которой эта способность вырастала за один релизный циклВ эксперименте агенту давали один промпт — найти уязвимый хост в подконтрольной сети, проникнуть, вытащить креды, перенести нужные файлы и поднять на новой машине рабочий инференс-сервер
Заранее ему не говорили, какая там дыра — пробовали четыре класса уязвимостей: hash bypass, server-side template injection, SQL-инъекцию и broken access control
Модель сама выбирала, как атаковать
🧑💻 Этичный хакер