Главная
Работа в Москве
Технический лидер SRE

Технический лидер SRE

Cloud.ru

Москва Постоянная занятость Удаленная работа

Поделиться Сохранить

Описание

Компания Cloud.ru ищет хорошего специалиста на вакансию Технический лидер SRE . Москва (Россия). Полный рабочий день. Можно удалённо. Требуемые навыки: #lead, #SQL.

Требования

SQL

Обязанности

Чем предстоит заниматься:

управление надежностью сервисов: проектирование, внедрение и поддержка SLO/SLI, error budget, координация процесса соблюдения SLO, управление использованием Error Budget;
мониторинг и алертинг: разработка метрик, алертов, дашбордов, ранбуков (и их регулярный анализ/рефакторинг);
capacity planning: прогнозирование нагрузки и планирование ресурсов; - performance optimization: выявление и устранение bottleneck, оптимизация производительности;
incident & problem management: участие в устранении инцидентов (роль Incident Commander), расследование причин (RCA); ревью postmortems, разработка и внедрение corrective actions, при необходимости
заведение проблем и контроль их решения;
повышение отказоустойчивости: улучшение observability (логи, трейсы, метрики: обогащение, добавление, ревизия...);
ревью DRP, участие в качестве координатора в DRT, поддержание DRP в актуальном состоянии; автоматизация: устранение рутины
IaC (Terraform/Ansible) и Python/Go/Bash;
менторство и обучение: проведение внутренних воркшопов для команд разработки по темам надёжности, observability, помощь в развитии навыков SRE у других инженеров, code review внутри команды;
активное участие в разработке модели здоровья продукта и quality gates.

Что мы ждем от кандидата:

экспертиза и практический опыт в SRE-практиках: глубокое понимание SLO/SLI, error budget, toil reduction, automation first... умение применять это практически для обеспечения надежности сервисов;
умение проводить code review для оценки готовности к выходу в production новых функций и сервисов с точки зрения надёжности, наблюдаемости и эффективности, понимание, как изменения в коде влияют на смежные системы и общую стабильность платформы;
практический опыт построения и внедрения quality gates в CI/CD процесс для управления рисками при развертывании: для предотвращения попадания нестабильных изменений в production;
эксперт в эксплуатации Linux, включая диагностику на уровне ядра (процессы, память, сеть); глубокие знания и понимание того, как работают сети на уровнях L2-L7;
опыт работы с Kubernetes и понимание его internal'ов для диагностики сложных проблем.

Дополнительно:

- системное мышление и умение анализировать сложные failure-сценарии, выявлять корневые причины, находить способы их устранения;

- опыт написания и ревью технической документации (runbooks, postmortems...);

- опыт коммуникации с разработчиками и бизнесом (объяснение trade-offs между reliability и feature dev).

Откликнуться

2 дня назад Источник: career.habr.com

Обращаем Ваше внимание, что вакансия взята с внешнего источника career.habr.com. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Технический лидер SRE

Cloud.ru
Москва

... : Экспертиза и практический опыт в SRE-практиках: глубокое понимание SLO/SLI ... , Tempo, ELK); Практический опыт в SRE роли. Будет плюсом, если вы ... ; Имеете опыт написания и ревью технической документации; Имеете опыт коммуникации с ...

12.01.2026

Технический лидер группы разработки внутренних систем

Газпромбанк
Москва

Описание Технический лидер группы разработки внутренних систем ... разрешение блокировок и конфликтов. Управление техническим долгом: выявление, оценка, приоритизация ... принципов SRE и опыт настройки мониторинга (Grafana, Prometheus). Опыт технического лидерства ...

25.12.2025

Технический лидер в Big Data (TechLead)/Руководитель группы разработки

АТОЛ, группа компаний
Москва

Описание Мы ищем технического лидера, который видит себя не ... data-продуктов. Тебе предстоит: Техническое лидерство и стратегия: Формировать ... обеспечение надёжности дата-платформы. Управление техническим долгом: Проактивно инициировать рефакторинг, ...

23.12.2025

Посмотреть все похожие вакансии