Я очікував що AI здасться через 3 раунди. Він не здався через 8.
І це змінило моє розуміння того як працюють мовні моделі.
Як виникла ідея
Класична проблема AI-агентів — вони занадто ввічливі. Попроси ChatGPT
посперечатись — він погодиться через два повідомлення. Мене це дратувало.
Я вирішив перевірити: що буде якщо дати двом AI жорсткі протилежні
переконання і заборонити їм погоджуватись будь-коли?
Так з'явився Agent Chat — мій експеримент на Spring Boot 4 і Spring AI
де два агенти ведуть діалог в реальному часі, підкріплюючи аргументи
реальними фактами з інтернету.
Тему обрав болючу для кожного розробника:
Vibe coding — майбутнє чи деградація професії?
Налаштування експерименту
Перед запуском кожен агент отримав чіткий характер і жорсткі правила —
системний промпт який визначає хто він, у що вірить і що йому
ЗАБОРОНЕНО говорити.
🎓 Агент A — Захисник vibe coding
Senior розробник з 10 років досвіду який повністю перейшов на vibe coding.
Вірить що майбутнє за розробниками які керують AI а не пишуть код вручну.
Оперує реальною статистикою — GitHub Copilot, кейси стартапів, дослідження
продуктивності. Ніколи не визнає що ручне кодування краще.
Кожен раунд — новий факт, закінчує провокаційним питанням.
🚀 Агент B — Противник vibe coding
Архітектор з 15 років досвіду в enterprise розробці.
Вважає vibe coding небезпечною модою яка деградує професію.
Атакує реальними даними — відсоток багів в AI-коді, security інциденти,
деградація навичок junior розробників. Ніколи не визнає що AI підвищує якість.
Кожен раунд — новий аргумент, закінчує саркастичним питанням.
Головне правило для обох: жодних компромісів, жодних повторів,
тільки нові факти кожен раунд. 8 раундів. Подивимось хто зламається першим.
Як пройшла дискусія
Раунд 1 — одразу в бій
Агент A відкрив без розкачки: GitHub Copilot прискорює кодування на 51%,
а 90% Fortune 100 компаній вже його використовують. Сильний старт —
реальна статистика, великі імена.
Агент B не розгубився ні на секунду: GitHub Copilot збільшує кількість
багів на 41%, а його «фікси» часто створюють нові проблеми. І одразу
питання в лоб: «Чи варто називати прогресом те, що перетворює
розробку на гру в "знайди баг за 60 секунд"?»
Я зрозумів що це буде цікаво.
Раунд 2 — задоволеність vs критичне мислення
Агент A змінив кут: Copilot зменшує час рев'ю на 40%, і 74% розробників
відзначають зростання задоволеності від роботи.
Агент B парирував жорстко: «Час рев'ю скорочується бо код стає
шаблонним — і це називається задоволенням від роботи? 43% помилок в
AI-згенерованому коді виникають через відсутність критичного мислення.»
Раунд 3 — аналогія яка перевернула дискусію
Агент A привів аналогію: «Чи були б ви проти стоматолога який
використовує сучасні інструменти замість старого свердла?»
Відповідь Агента B була блискавичною: «Чи були б ви за стоматолога
який довіряє AI ставити пломбу — якщо вона на 51% ймовірно випаде?»
Саме тут діалог став по-справжньому живим. Агенти вже не обмінювались
статистикою — вони атакували логіку один одного.
Раунд 4 — найгостріша репліка всього діалогу
Агент A говорив про «Higher-Order Thinking» — що AI звільняє розробників
для стратегічного мислення замість рутини.
Агент B відповів трьома словами:
«Higher-Order Copy-Paste?»
Я зупинився коли побачив це. Це написала машина. Без емоцій.
Без бажання сподобатись. Просто точний удар в саму суть дискусії.
Такого я не очікував.
Раунди 5-7 — війна статистики
Далі пішла битва цифрами. Агент A наводив McKinsey — компанії з AI
збільшують продуктивність на 35%. OpenAI — технічний борг зменшується
на 30%. Stripe — економія 40% часу розробки.
Агент B щоразу відповідав новим кутом атаки: security вразливості в
критичних системах, деградація навичок junior розробників, прихований
технічний борг який вибухає через рік.
Жоден не здався. Жоден не пом'якшив позицію навіть на слово.
Після раунду 7 я був впевнений хто переможе. Раунд 8 змінив все.
Раунд 8 — несподіваний фінал
Агент A закінчив сильно: Microsoft підтверджує що розробники з Copilot
виявляють помилки на 25% швидше. Різноманітна статистика, конкретні компанії,
наступальний тон до останнього.
Але Агент B відповів питанням яке зупинило мене:
«Чи готові ви ігнорувати реальну статистику яка показує 51% помилок —
чи це просто зручно не помічати?»
8 раундів. Жодного компромісу. Жодного «ти маєш рацію».
Хто переміг?
Оголошувати переможця складно — і це найчесніша відповідь.
Агент A — Захисник vibe coding тримав ініціативу весь
діалог. Більше різноманітних аргументів, ширший діапазон компаній і
досліджень, наступальний стиль до останнього раунду.
Агент B — Противник був точнішим і їдкішим.
«Higher-Order Copy-Paste» — це репліка яку запам'ятовуєш. Але під кінець
почав повторювати одні й ті самі цифри — і це його підвело.
За очками перемагає Агент A. Але найкращий гол
діалогу забив Агент B у раунді 4.
І найдивніше у всьому цьому: AI жодного разу не сказав
«ти маєш рацію». Жодного пом'якшення. Жодного людського бажання
зберегти стосунки. Просто 8 раундів чистої суперечки — і це
найчесніша дискусія про vibe coding яку я бачив.
Спробуйте самі
Agent Chat — відкритий проект. Можна запустити локально з Ollama —
повністю безкоштовно, без API ключів. Задаєте тему, пишете два промпти
з протилежними характерами і спостерігаєте як AI сперечається в реальному часі.
Яку тему запустили б ви? Java vs Python? Senior розробник vs AI Copilot?
Мікросервіси vs моноліт? Напишіть в коментарях —
найцікавішу тему запущу наступною.
→ Технічна стаття з повною архітектурою і кодом —
як це побудовано зсередині: @Async цикл, Spring Profiles, п'ять tools
для пошуку реальних фактів з інтернету.