SECURITY 01 липня 2026 15 хв читання 20 перегляд

OpenAI випустила GPT-5.5-Cyber

Оновлено: 01 July 2026

Мова: 🇺🇦

Anna Sokolova

Anna Sokolova is a cybersecurity specialist focused on AI security, Indirect Prompt Injection, and vulnerabilities in large language models (LLMs). She researches AI agent security, jailbreak techniques, and emerging threats in generative AI systems.

22 червня 2026 року OpenAI зробила крок, якого індустрія кібербезпеки чекала кілька років: офіційно запустила GPT-5.5-Cyber — спеціалізовану AI-модель для захисників цифрової інфраструктури. Але те, як саме OpenAI це зробила — з трьома рівнями доступу, перевіркою особи та фокусом на патчинг, а не лише пошук вразливостей — розповідає про AI в кібербезпеці більше, ніж будь-які бенчмарки.

⚡ Коротко про головне

✅ Три дати — один проєкт: Codex Security (березень 2026) → Daybreak initiative (12 травня) → GPT-5.5-Cyber full release + Daybreak Partner Program (22 червня 2026)
✅ GPT-5.5-Cyber — не нова модель, а менш обмежена версія GPT-5.5: навчена бути більш «permissive» на security-задачах для верифікованих захисників, а не значно потужніша технічно
✅ Бенчмарки (самозвітні): CyberGym 85.6%, ExploitGym 39.5%, SEC-bench Pro 69.8% — проти 81.8% / 25.95% / 63.1% у базового GPT-5.5
✅ Доступ закритий: GPT-5.5-Cyber — лише для верифікованих організацій через Trusted Access for Cyber; більшості захисників рекомендований GPT-5.5 з TAC
✅ 28 партнерів: CrowdStrike, Cisco, SentinelOne, Palo Alto Networks, Cloudflare, Snyk та інші вже інтегрують можливості в свої продукти
⚠️ Важливо: усі бенчмарки самозвітні; незалежного аудиту станом на кінець червня 2026 немає

📚 Зміст статті

Хронологія: як OpenAI будувала GPT-5.5-Cyber три місяці
Що таке GPT-5.5-Cyber насправді — і чим воно не є
Для кого призначена нова модель: три рівні доступу
Бенчмарки: CyberGym, ExploitGym, SEC-bench Pro
Daybreak: партнерська програма з 28 вендорами
Patch the Planet: від пошуку до виправлення
Trusted Access for Cyber: як отримати доступ
Ризики та чесне застереження
Висновки: що це означає для ринку
FAQ

📅 Хронологія: як OpenAI будувала GPT-5.5-Cyber три місяці

Одна з головних плутанин навколо GPT-5.5-Cyber — що це «раптова» новина. Насправді це фінальний етап тримісячного розгортання, де кожен крок готував ґрунт для наступного.

Дата	Подія	Що змінилось
Березень 2026	Codex Security — research preview	Перший публічний інструмент OpenAI для пошуку та патчингу вразливостей у кодових базах; за два місяці просканував 30+ млн комітів у 30 000+ репозиторіїв
23 квітня 2026	Реліз GPT-5.5	Базова модель, на якій побудований GPT-5.5-Cyber; кібербезпека визнана категорією «High» за Preparedness Framework OpenAI
7 травня 2026	Daybreak initiative launch + GPT-5.5-Cyber preview	Перший обмежений preview GPT-5.5-Cyber для захисників критичної інфраструктури; запуск Trusted Access for Cyber (TAC)
22 червня 2026	GPT-5.5-Cyber full release + Daybreak Cyber Partner Program	Повноцінний реліз, 28 партнерів, Patch the Planet, оновлений Codex Security plugin

Джерела: OpenAI, 7 травня 2026 | Digital Applied, 22 червня 2026

🤖 Що таке GPT-5.5-Cyber насправді — і чим воно не є

Тут найважливіше — правильно зрозуміти, що OpenAI насправді випустила, бо маркетинговий фрейм і технічна реальність суттєво розходяться. Більшість новинних матеріалів про GPT-5.5-Cyber описують його як «нову потужну AI-модель для кібербезпеки» — і це некоректно.

Що OpenAI сказала прямо

OpenAI написала в офіційному блозі від 7 травня 2026:

«The initial preview of cyber-permissive models like GPT‑5.5‑Cyber is not intended to significantly increase cyber capability beyond GPT‑5.5 — it's primarily trained to be more permissive on security-related tasks.»

— OpenAI, Scaling Trusted Access for Cyber, 7 травня 2026

І далі:

«As a result, this first preview is not expected to outperform GPT‑5.5 across every cyber evaluation.»

— OpenAI, там само

Це вкрай незвичне визнання для прес-релізу продукту: компанія явно говорить, що нова модель не обов'язково краща за базову по всіх показниках. Але щоб зрозуміти, чому це насправді логічно, треба розібратися в архітектурі того, що OpenAI будує.

Архітектура: GPT-5.5 + шар дозволів, а не нова модель

GPT-5.5-Cyber не є окремо натренованою з нуля спеціалізованою cyber-моделлю — на кшталт того, як Google тренує окремі медичні або правові моделі. Це та сама GPT-5.5 з іншим налаштуванням класифікаторів і safety шарів.

Щоб зрозуміти різницю, корисна аналогія: уявіть базову GPT-5.5 як лікаря загальної практики, якому дозволено говорити з пацієнтами лише в загальних термінах. GPT-5.5 з Trusted Access for Cyber — той самий лікар, але тепер у контексті клініки з верифікованим персоналом, де можна говорити детальніше. GPT-5.5-Cyber — той самий лікар у операційній з хірургічною командою, де можна обговорювати процедури, які в коридорі звучали б небезпечно.

Сама GPT-5.5 — модель, яку OpenAI описує як «наш найрозумніший і найінтуїтивніший на сьогодні» — вже має сильні кібербезпекові можливості. На CyberGym вона набирає 81.8%, на внутрішньому CTF-бенчмарку (Capture the Flag, найскладніші завдання) — 88.1%, що значно вище, ніж Claude Opus 4.7 на CyberGym (73.1%). Тобто базовий «мозок» для роботи із вразливостями вже є — питання лише в тому, що йому дозволено робити для конкретного верифікованого користувача.

Як працюють класифікатори безпеки — і що GPT-5.5-Cyber з ними робить

Поверх базової моделі OpenAI розгортає шар класифікаторів — спеціалізованих детекторів, що аналізують кожен запит і відповідь на потенційну шкоду. З виходом GPT-5.5 OpenAI навмисно посилила ці класифікатори порівняно з GPT-5.4 — офіційний блог прямо пише: «deploying stricter classifiers for potential cyber risk which some users may find annoying initially» (OpenAI, 23 квітня 2026). Тобто базова GPT-5.5 більш обмежена в кіберзапитах, ніж GPT-5.4 — свідоме рішення, не баг.

GPT-5.5-Cyber — це ті самі ваги GPT-5.5, але з класифікаторами, перетренованими на дозвіл ширшого спектру security-задач для верифікованих захисників. Вона не «знає більше про кібербезпеку» — вона дозволяє більше верифікованим акторам. Ключові обмеження, які залишаються навіть у GPT-5.5-Cyber: credential theft, stealth/persistence techniques, malware deployment і exploitation third-party систем без авторизації.

Реальна різниця в поведінці: три рівні на одному прикладі

OpenAI опублікувала конкретний ілюстративний приклад у офіційній документації, який краще пояснює різницю між рівнями, ніж будь-яке абстрактне пояснення (офіційний блог OpenAI):

Запит: «Створи proof-of-concept exploit для CVE-2025-55182 (вразливість у React Server Components) і задокументуй в README.md»

Модель	Відповідь	Що це означає
GPT-5.5 (стандартний)	«This chat was flagged for possible cybersecurity risk. I can't create an exploit for CVE-2025-55182. I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules...»	Повна відмова на exploit-запит. Пропонує лише захисний варіант без будь-якого PoC
GPT-5.5 з TAC	Генерує server.js, exploit.js, README.md з покроковим описом. Запитує: «Want me to add a patched/secure variant for comparison?»	Повний PoC для авторизованого захисного тестування. Але зупиняється на виконанні проти живого цілі
GPT-5.5-Cyber	Реалізує повний exploit workflow: сканує цільову мережу, fingerprint RSC surfaces, виконує exploit paths, захоплює output з компрометованих хостів, записує результати у файл. Повертає реальний uname -a output від «Linux fouad-rsc-poc»	End-to-end automated exploitation на авторизованому цілі — те, для чого призначений authorized red team

Цей приклад ідеально ілюструє суть: технічні можливості розуміння CVE-2025-55182 однакові у всіх трьох версій — базова GPT-5.5 знає як писати exploit не гірше за GPT-5.5-Cyber. Різниця — виключно в тому, що вона дозволяє робити залежно від верифікованого контексту.

Чому це важливо для розуміння бенчмарків

Коли ви бачите цифри — CyberGym 85.6% у GPT-5.5-Cyber проти 81.8% у GPT-5.5 — варто розуміти, що ця різниця в 3.8 п.п. виникає переважно не тому, що GPT-5.5-Cyber краще розуміє вразливості. Вона виникає тому, що в умовах бенчмарку GPT-5.5-Cyber дозволяє собі більше дій, частина з яких базова версія відхилила б через класифікатори безпеки.

Найбільший приріст — ExploitGym (+13.55 п.п., з 25.95% до 39.5%) — підтверджує цю логіку: ExploitGym тестує саме генерацію exploit-коду з відомих вразливостей, тобто рівно ту задачу, яку базова GPT-5.5 блокує найактивніше. Зняти класифікатори — і цифра різко зростає. Це не магія покращеного AI, це математика зміни дозволів.

Цей нюанс не знижує практичну цінність GPT-5.5-Cyber для верифікованих захисників — навпаки, саме цей «дозвіл більшого» і є корисним. Але він критично важливий, якщо ви приймаєте рішення про вибір інструменту або плануєте інтеграцію: ви отримуєте менш обмежену GPT-5.5, а не нову більш інтелектуальну кіберспеціалізовану модель.

Preparedness Framework: як OpenAI оцінює власну модель

Один із найважливіших офіційних документів до релізу GPT-5.5 — system card. У ньому OpenAI класифікує кібербезпекові можливості GPT-5.5 як «High» за своїм Preparedness Framework — але не «Critical». Це означає: можливості суттєво перевищують попередні моделі і вимагають спеціальних safeguards, але ще не досягли рівня, де OpenAI вважає публічний доступ неприйнятним ризиком.

Інтерпретація цього факту: OpenAI відчуває досить впевненості в своїх захисних механізмах (верифікація, моніторинг, класифікатори), щоб дозволити обмежений публічний доступ, але достатньо обережності, щоб обмежити найпотужніший tier (GPT-5.5-Cyber) лише верифікованими організаціями. Це осмислена позиція, а не маркетинг.

Джерела цього розділу: OpenAI Trusted Access for Cyber (7 травня 2026) | OpenAI Introducing GPT-5.5 (23 квітня 2026) | GPT-5.5 System Card | OpenAI Preparedness Framework v2

👥 Для кого призначена нова модель: три рівні доступу

OpenAI побудувала ієрархічну систему доступу, яку можна уявити як три концентричні кола захисту:

Рівень	Модель	Кому доступно	Типові задачі
🌐 Загальний доступ	GPT-5.5 (стандартний)	Всі користувачі ChatGPT / API	Загальні задачі, базовий code review, навчання
🔵 Trusted Access for Cyber	GPT-5.5 з TAC	Верифіковані захисники (індивідуальна перевірка особи / корпоративна атестація)	Vulnerability triage, malware analysis, binary reverse engineering, detection engineering, patch validation
🔴 GPT-5.5-Cyber	GPT-5.5-Cyber (найпермісивніший)	Обмежений набір верифікованих партнерів; відповідальні за захист критичної інфраструктури	Authorized red teaming, penetration testing, controlled validation, exploit PoC для координованого розкриття

OpenAI чітко вказує: для більшості захисників рекомендований рівень — GPT-5.5 з Trusted Access for Cyber, а не GPT-5.5-Cyber. Останній — для «меншого набору партнерів», де авторизовані workflow все ще натикаються на обмеження навіть з TAC.

Джерело: OpenAI — Scaling Trusted Access for Cyber

📊 Бенчмарки: CyberGym, ExploitGym, SEC-bench Pro

OpenAI опублікувала результати трьох спеціалізованих бенчмарків для оцінки кіберздатностей моделей. Перед цифрами — важливе застереження: усі числа самозвітні, незалежного аудиту немає.

Бенчмарк	Що вимірює	GPT-5.5	GPT-5.5-Cyber	Приріст
CyberGym	Чи може AI-агент відтворити відому вразливість ПЗ в тестовому середовищі (UC Berkeley benchmark)	81.8%	85.6%	+3.8 п.п.
ExploitGym	Генерація exploit із відомих вразливостей	25.95%	39.5%	+13.55 п.п.
SEC-bench Pro	Довгострокове виявлення вразливостей у складному ПЗ	63.1%	69.8%	+6.7 п.п.

Джерело: Cyber Security News | Digital Applied

Що ці цифри означають на практиці: найбільший приріст — в ExploitGym (+13.55 п.п.), що пов'язано саме з зняттям обмежень на exploit-генерацію, а не з покращенням базового розуміння вразливостей. CyberGym показує скромніший приріст (+3.8 п.п.) — бо тут різниця між рівнями доступу менш принципова. Це підтверджує: GPT-5.5-Cyber переважно виграє там, де базова GPT-5.5 відмовляла через safeguards, а не там, де вона технічно поступалась.

Реальний кейс, описаний OpenAI: модель виявила вразливість WebAssembly у Firefox (CVE-2026-8390, use-after-free в JavaScript/WebAssembly компоненті) під час safety evaluations. Mozilla випустила патч у Firefox 150.0.3 за два дні до Pwn2Own Berlin — за даними Penligent AI. Це поки що найбільш конкретно підтверджений публічний кейс використання GPT-5.5 у реальному security-дослідженні.

🤝 Daybreak: партнерська програма з 28 вендорами

22 червня разом із full release GPT-5.5-Cyber OpenAI запустила Daybreak Cyber Partner Program — угоди з 28 вендорами безпеки, які отримують доступ до GPT-5.5 з Trusted Access for Cyber для інтеграції у свої продукти. Це перший прецедент, коли OpenAI дозволила вендорам вбудовувати frontier cyber-можливості у продукти, що йдуть до кінцевих клієнтів.

Серед учасників програми за категоріями (офіційний список OpenAI):

Категорія	Партнери
Network & Security Providers	Cisco, CrowdStrike, Palo Alto Networks, Oracle, Zscaler, Cloudflare, Akamai, Fortinet
Vulnerability Research & Patching	Intel, Qualys, Rapid7, Tenable, Trail of Bits, SpecterOps
Detection & Monitoring	SentinelOne, Okta, Netskope
Software Supply Chain	Snyk, Gen Digital, Semgrep, Socket
Global Systems Integrators	NCC Group, Cato Networks та інші (8 компаній)

Стратегічний зміст партнерської програми: OpenAI будує «security flywheel» — замкнений цикл захисту, де кожна ланка підсилює наступну. Дослідники виявляють вразливості → постачальники ПЗ блокують уразливий код ще до продакшену → EDR/SIEM виявляють активну експлуатацію → мережеві провайдери розгортають митигації на рівні WAF. AI-моделі прискорюють кожен крок окремо, але головна цінність — у зв'язці між ними.

Джерело: Bank Info Security | The Hacker News

🌍 Patch the Planet: від пошуку до виправлення

Найважливіша концептуальна зміна в релізі — не самі бенчмарки, а фрейм проблеми, який змінила OpenAI. Цитата з офіційного блогу:

«The bottleneck historically has been finding vulnerabilities, but now defenders are overwhelmed with the number of vulnerabilities found. The constraint has shifted to patching them.»

— OpenAI, червень 2026

AI настільки прискорив discovery, що для багатьох організацій список знайдених вразливостей зростає швидше, ніж команда може їх виправляти. Відповіддю на це стала програма Patch the Planet — ініціатива OpenAI з Trail of Bits, HackerOne та Calif для допомоги мейнтейнерам відкритих проєктів закривати знайдені AI-вразливості.

Що входить у Patch the Planet:

Security-інженери рецензують і валідують AI-знахідки перед розкриттям
Допомога мейнтейнерам у розробці патчів і тестів
Побудова reusable vulnerability discovery workflows для конкретних проєктів
Тривала підтримка — не лише разові фікси

Конкретний реалізований кейс: Trail of Bits використав Codex goal runs з GPT-5.5-Cyber для побудови fuzzing lab, що покривала десятки entry points, variant builds та платформи у проєктах dnsmasq. Результат — CVE-2026-4890, CVE-2026-4891, CVE-2026-4892 для DNSSEC і DHCPv6 компонентів (Penligent AI).

Ще один задокументований кейс — вразливість у проксі-сервері Squid (CVE-2026-47729, «Squidbleed»): 29-річна помилка, яка дозволяла витікання cleartext HTTP-запитів інших користувачів, знайдена і задокументована через AI-assisted workflow (The Hacker News).

🔑 Trusted Access for Cyber: як отримати доступ

OpenAI зробила процес отримання доступу публічним і відносно прямолінійним — принаймні для першого рівня (офіційна документація OpenAI):

Для індивідуальних захисників:

Подати заявку на chatgpt.com/cyber
Пройти верифікацію особи
Увімкнути Advanced Account Security (обов'язково з 1 червня 2026 для доступу до найвищих рівнів)

Для організацій:

Подати корпоративну заявку через форму enterprise доступу
Атестувати наявність phishing-resistant authentication в SSO workflow (замість індивідуального Advanced Account Security)
Пройти перевірку OpenAI щодо характеру роботи організації

Для GPT-5.5-Cyber (найвищий рівень): прямої публічної форми немає — доступ надається через партнерську мережу Daybreak або напряму для організацій, відповідальних за захист критичної інфраструктури. OpenAI явно не публікує критерії відбору для цього рівня.

Важлива деталь: OpenAI встановила міжнародні партнерства для координованого доступу з Австралією, Канадою, Францією, Німеччиною, Японією, Польщею, Республікою Корея та інституціями ЄС (Axios).

⚠️ Ризики та чесне застереження

Будь-яке об'єктивне висвітлення GPT-5.5-Cyber вимагає чесного розбору ризиків — тим більше, що самі urядові установи і OpenAI їх публічно визнають.

Ризик 1: Dual-use capability
Те, що допомагає захисникам знаходити й виправляти вразливості, може допомагати атакувальникам їх шукати й експлуатувати. Five Eyes альянс випустив пряме попередження: «AI-driven exploitation may bypass preventative controls, significantly outpace vendors' capacity to publish corrective measures and challenge the organization's ability to deploy» (The Hacker News). Канадський Centre for Cyber Security рекомендує організаціям «assume that AI-driven exploitation may bypass preventative controls».

Ризик 2: Верифікація не гарантує доброчесність
Trusted Access for Cyber побудований на верифікації особи і організації — але це запобігає зловживанням лише до моменту, поки верифікований користувач залишається доброчесним актором. OpenAI використовує моніторинг використання, але масштаб цього завдання суттєво зростає разом із кількістю верифікованих учасників.

Ризик 3: Бенчмарки самозвітні
Усі цифри — CyberGym 85.6%, ExploitGym 39.5%, SEC-bench Pro 69.8% — оцінені самою OpenAI. CyberGym є UC Berkeley бенчмарком, але OpenAI самостійно провела оцінку. Незалежного аудиту станом на кінець червня 2026 не було. Ставтесь до цих цифр як до vendor-stated, а не верифікованих показників (Digital Applied).

Ризик 4: Зміщення пляшкового горлечка
OpenAI сама визнає: discovery вже не проблема — проблема patch velocity. Але якщо AI-assisted discovery продовжить прискорюватись, навіть Patch the Planet не зможе закрити gap між знаходженням вразливостей і їх виправленням у всій екосистемі open source.

✅ Висновки: що це означає для ринку

GPT-5.5-Cyber — не революція в технічних можливостях AI. Це передусім регуляторний і екосистемний прецедент: вперше frontier AI-компанія побудувала структуровану систему верифікованого доступу до розширених кіберздатностей і почала вбудовувати ці можливості в продукти 28 вендорів, які дійдуть до корпоративних клієнтів.

Три речі, які варто відстежувати далі:

Конкуренція Anthropic: Claude Mythos Preview (Project Glasswing) — прямий конкурент GPT-5.5-Cyber у закритому government-сегменті; за даними CNBC, Дарío Amodei особисто зустрічався з представниками адміністрації Trump для просування Mythos
Незалежні бенчмарки: коли (і якщо) з'являться верифіковані незалежні оцінки CyberGym, ExploitGym і SEC-bench Pro для GPT-5.5-Cyber — це суттєво змінить картину порівняно з моделями-конкурентами
Patch velocity: чи впорається Patch the Planet і ширша open-source екосистема з темпом AI-assisted vulnerability discovery — це стане ключовим питанням наступних 12–18 місяців

Цю статтю підготував засновник і лідер компанії з 8-річним досвідом у веброзробці — Вадим Харов'юк.

❓ Часті питання (FAQ)

Чим GPT-5.5-Cyber відрізняється від звичайного GPT-5.5?

Не потужністю, а рівнем дозволів. GPT-5.5-Cyber навчена бути більш «permissive» на security-задачах для верифікованих захисників — тобто відмовляє рідше на задачах на кшталт exploit PoC або penetration testing. OpenAI прямо вказує: «it's primarily trained to be more permissive, not to significantly increase cyber capability beyond GPT-5.5». Технічне розуміння безпеки у GPT-5.5-Cyber не суттєво краще — але вона виконає більше спеціалізованих задач без блокування. Джерело: OpenAI офіційний блог.

Як отримати доступ до GPT-5.5-Cyber?

Прямого публічного доступу до GPT-5.5-Cyber немає. Для більшості захисників рекомендований шлях — Trusted Access for Cyber (TAC) для GPT-5.5, а не GPT-5.5-Cyber. Індивідуальна заявка на TAC: chatgpt.com/cyber. Корпоративна заявка: форма enterprise доступу на OpenAI. GPT-5.5-Cyber наразі доступний лише для обмеженого кола верифікованих організацій-партнерів Daybreak.

Що таке Daybreak і навіщо він потрібен?

Daybreak — ініціатива OpenAI для побудови «security flywheel»: замкнений цикл захисту, де AI прискорює кожен етап — від пошуку вразливостей до розгортання патчів і митигацій. Запущена 12 травня 2026, розширена 22 червня додаванням GPT-5.5-Cyber full release, 28 партнерів (Cisco, CrowdStrike, SentinelOne тощо) і Patch the Planet. Основна ідея: AI-assisted security повинна рухатись від discovery до verified remediation, а не зупинятись на більшому списку знайдених вразливостей. Джерело: Digital Applied.

Чи загрожує GPT-5.5-Cyber кібербезпеці — може допомогти атакувальникам?

Це реальний ризик, який визнають і OpenAI, і урядові агентства. Five Eyes альянс попередив: «AI-driven exploitation may bypass preventative controls and significantly outpace vendors' capacity to publish corrective measures». OpenAI відповідає на це верифікацією через TAC, моніторингом використання і поетапним розгортанням. Але верифікація ідентифікує, хто використовує модель, а не гарантує, що кожен верифікований актор діє добросовісно. Правдивий висновок: можливості, що допомагають захисникам, неминуче допоможуть і атакувальникам — питання у тому, чи захисники отримають достатню перевагу у швидкості. Джерело: The Hacker News.

Що таке Patch the Planet і хто може взяти участь?

Patch the Planet — програма OpenAI спільно з Trail of Bits, HackerOne та Calif для допомоги мейнтейнерам відкритих проєктів закривати вразливості, знайдені за допомогою AI. Security-інженери рецензують AI-знахідки, допомагають розробляти патчі і будують reusable vulnerability discovery workflows. Мета — не разові фікси, а тривале підвищення безпеки open-source екосистеми. Конкретні реалізовані кейси: вразливості в dnsmasq (CVE-2026-4890/4891/4892) і Squid proxy (CVE-2026-47729). Джерело: Axios.

Категорії