Инженер мониторинга (Zabbix, Prometheus, Grafana)
БЮРО 1440Описание
Чем предстоит заниматься:
- Непрерывный мониторинг инфраструктуры и приложений, настройка и поддержка алертов.
- Настройка и оптимизация коллекторов метрик (Node Exporter, cAdvisor, JMX, приложения, API-запросы и т.д.)
- Диагностика инцидентов, проведение пост мортемов, разработка автоматических действий при сбоях (auto remediation).
- Интеграция мониторинга с CI/CD, CMDB, системой ServiceDesk, системами оповещения.
- Помощь в определении метрик, установке Service Level Indicators (SLI) и Service Level Objectives (SLO).
- Проведение воркшопов, обучение коллег работе с дашбордами и системами алертинга.
- Поддержание актуальной документации (архитектура мониторинга, процедуры реагирования).
- Разработка и внедрение best practice по мониторингу и observability.
Требования к кандидату:
- Опыт работы от 3 лет на схожей позиции (с акцентом на систему мониторинга).
- Глубокое понимание принципов работы систем мониторинга: Zabbix, Prometheus, Grafana, Alertmanager.
- Опыт настройки мультисайтовой или геораспределённой системы мониторинга.
- Опыт настройки и масштабирования Prometheus (включая кастомные экспортеры, relabeling, remote write/read, Thanos/Cortex).
- Уверенное владение Grafana: создание сложных дашбордов, использование переменных, визуализация, темы, шаринг.
- Знание языков и инструментов: Bash, Python, JSON, YAML, REST API.
- Опыт работы с системами оповещения и управления инцидентами (в т.ч. через API).
- Навыки анализа логов и метрик.
- Понимание принципов SLI/SLO, error budget, incident management.
Мы предлагаем:
- Работу в аккредитованной ИТ-компании;
- Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным;
- Возможность выбора формата работы (офис/гибрид/удаленка);
- Оформление в соответствии с ТК РФ;
- Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.