SRE-специалист (Телеком)
YADROОписание
Команда занимается развитием и поддержкой инфраструктуры продукта и одним из важных направлений является обеспечение надежности, производительности и отказоустойчивости компонентов продукта. Для этих целей в продукт были внедрены средства мониторинга, сбора логов и трейсов, а также визуализация и алертинг, которые позволяют отслеживать внутреннее состояние компонентов продукта и сигнализизировать в случае возникновения аномальных ситуаций. В данном направлении команда непосредственно занимается деплоем, оптимизацией компонентов observability, созданием дашбордов, алертов, построением отказоустойчивой инфраструктуры в области observability.
Чем предстоит заниматься:
- Повышать надежность, наблюдаемость компонентов продукта;
- Автоматизация работ по развертыванию и обновлению компонентов, связанных с наблюдаемостью системы;
- Проектировать, внедрять и поддерживать метрики, alerts, dashboards в актуальном состоянии;
- Проектировать и внедрять отказоустойчивую архитектуру компонентов продукта;
- Взаимодействовать с командой разработчиков, участвовать в процессах ревью продуктовых требований.
Что мы требуем от будущего члена команды:
- Опыт работы с операционной системой Linux на уровне администратора;
- Опыт работы с системами мониторинга Prometheus/VictoriaMetrics, визуализации данных с помощью Grafana;
- Опыт работы с системами сбора и хранения логов/трейсов;
- Опыт работы с Ansible;
- Знание одного или нескольких скриптовых языков Python/Bash;
- Понимание принципов построения отказоустойчивых систем.
Будет плюсом:
- Опыт работы с базой данных Clickhouse;
- Опыт работы с OpenTelemetry Collector.
месяц назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
250 091 - 385 975 руб.
... своих бизнес-критических задач. =============================== Приглашаем специалиста по информационной безопасности и защите ... -инфраструктурой совместно с DevOps и SRE специалистами. ** Дополнительные задачи (30% времени): ** Участие ...
12.01.2026
... инфраструктуры; Глубокое понимание архитектуры телеком-инфраструктуры оператора, интеграции систем ... CKAD (Kubernetes), Google Professional SRE; Приветствуется знание отраслевых стандартов ... , eTOM, TM Forum, SRE principles); Будет плюсом понимание нормативной ...
13.01.2026
Описание Компания Navio ищет хорошего специалиста на вакансию SRE-инженер . Москва (Россия). Полный ... и IT-компаний. Больше 800 специалистов каждый день работают над тем ... от кандидата Глубокое понимание принципов SRE и культуры надежности; Подтвержденный опыт ...
08.01.2026