Тема
Режим
Язык
Тема
Режим
Язык
Консультация
FREE Бесплатный аудит сайта за 15 мин Заказать →
NEW Остановили 2 млн атак credential stuffing Кейс →
Разборы атак и инструменты Telegram →
70% трафика могут быть ботами Проверить →
SOS Сайт под атакой? Поможем за 30 мин SOS →

Bot-traffic: как отсеивать «умных» ботов

Fingerprinting, правила, валидация и наблюдаемость. Подход к фильтрации ботов без ложных срабатываний.

Боты — это не только плохо. Googlebot, мониторинг, API-интеграции — это нужные боты. Задача — отсеять вредных, не задев полезных.

HTTP Flood

Как боты атакуют ваш сайт

Боты-браузеры
Headless Chrome
HTTP Requests
WAF
JS Challenge
0% 0%
Валидные
Backend
DB
Онлайн

Ботнет генерирует тысячи HTTP-запросов, имитируя реальных пользователей с валидными заголовками.

Каждый запрос проходит через веб-сервер → приложение → базу данных. CPU и RAM растут.

Приложение перестаёт отвечать. 502/503 для всех пользователей. Бизнес теряет деньги.

Поведенческий анализ, JS-challenge и rate limiting фильтруют ботов от людей.

01

User-Agent фильтрация

Первый уровень защиты

Простые боты не скрывают себя. Блокируем очевидное:

Блокировка по User-Agent
# В server блоке\nif ($http_user_agent ~* (scrapy|curl|wget|python-requests|Go-http-client|java|httpclient)) {\n    return 403;\n}\n\n# Пустой User-Agent\nif ($http_user_agent = \"\") {\n    return 403;\n}
🔥
Внимание
Не блокируйте curl/wget полностью, если используете их для мониторинга. Добавьте исключения по IP.
02

Проверка Googlebot

Отличаем настоящего от подделки

Многие боты притворяются Googlebot. Настоящий — приходит с IP Google и проходит reverse DNS.

Проверка Googlebot
03

JavaScript Challenge

Отсеиваем headless-ботов

Умные боты используют headless-браузеры (Puppeteer, Playwright). Их сложнее отличить, но возможно:

Чек-лист защиты от ботов

0 / 10
Используйте Let's Encrypt или Cloudflare для бесплатных сертификатов
Лимитируйте /login, /api, /search — основные точки атак
Cloudflare WAF, ModSecurity или аналоги
Снижает нагрузку на origin в 5-10 раз
Grafana + Prometheus или встроенный в CDN
Быстрое переключение при атаке на основной
Телефон техподдержки для экстренных случаев
Блокировка регионов откуда не ждёте трафик
hCaptcha или Cloudflare Turnstile
Telegram/Slack уведомления при аномалиях
Мониторинг важнее блокировки
<a href="/articles/monitoring-alerts-guide">Мониторинг</a> важнее блокировки. Не блокируйте всё подряд. Сначала наблюдайте: кто приходит, с какими User-Agent, на какие URL. Потом блокируйте точечно с помощью <a href="/articles/rate-limit-nginx">rate-limit</a>.

Тест: Bot-traffic: как отсеивать «умных» ботов

Вопрос 1 из 3
Как отличить настоящий Googlebot от поддельного?
Настоящий Googlebot приходит с IP Google и проходит reverse DNS.
Какие браузеры используют умные боты?
Умные боты используют headless-браузеры.
Какой инструмент используется для детекции ботов?
JavaScript fingerprinting проверяет поведение браузера.
0 / 3

Получите план защиты под ваш сайт

Оставьте контакт и адрес сайта — пришлём план защиты и список приоритетных шагов.

  • Приоритетные шаги на 7 дней
  • Быстрая обратная связь
  • План в удобном формате
Без спама. Можно указать Telegram (@username) или email.
Написать в Telegram