← Все статьи

QA за 24 часа: автономный AI-агент вместо ручной регрессии

RankCaster AI собрал автономного тестировщика на Claude Code, agent-browser и read-only psql — регрессия с 48 часов до 40 минут.

Содержание

Коротко

Стартап RankCaster AI заменил ручную регрессию автономным AI-агентом: за сутки развернули стек без Selenium/Cypress, снизили прогон с 48 часов до 10–40 минут и стоимость проверки с ~$250 до ~$5 за полный проход.

Что произошло

На стадии Pre-Seed каждый новый релиз раздувал COGS: больше фич — больше сценариев QA. Команда отказалась от «прокликивания» дашбордов и собрала систему из трёх частей:

Компонент Роль
Claude Code Принимает решения по визуальному контексту
agent-browser (Rust + Chrome CDP) Управляет реальным Chrome через CLI
SSH / psql (read-only) Сверяет UI с данными в тестовой БД

Агент читает Accessibility Tree, а не координаты пикселей: смена ID или цвета кнопки не ломает сценарий. После клика по фильтру он формирует SQL и сравнивает цифры на графике с таблицами.

За первую неделю нашли баги, которые пропустили люди: ошибка APR при редком наборе фильтров (расхождение API и БД) и CSS clipping на графиках.

Почему это важно

Это не «замена QA-отдела», а смена модели: рутинная регрессия и первичный root-cause analysis уходят в автоматизацию, инженер фиксирует найденное детерминированным тестом (Vitest).

Подход интересен тем, что обходит классические E2E-фреймворки: семантическая навигация + прямая проверка БД в одном проходе по UI, API и данным.

На практике

  1. Изолированные QA-аккаунты на beta-стенде и один файл «памяти» с паттернами команд — без скрипта на каждую кнопку.
  2. Data masking: агент работает с shadow-копией БД; PII заменяется ETL перед копированием со staging.
  3. В GitHub Actions каждый прогон — отдельный контейнер; при расхождении данных релиз блокируется.
  4. Canvas и сверхсложная визуализация — слабое место; критические пути и логические аномалии закрывает агент, тонкую вёрстку — человек.
  5. Найденный баг → Vitest-тест, чтобы не платить за тот же сценарий повторно.

Итог

Кейс с Habr — практичный пример agentic QA в 2026: дешевле ручной регрессии, быстрее отчёт (скрин, лог, SQL). Полная замена тестировщиков не заявлена — но экономика и скорость релизов меняются заметно.