Локация

SRE-специалист (Телеком)

YADRO
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Команда занимается развитием и поддержкой инфраструктуры продукта и одним из важных направлений является обеспечение надежности, производительности и отказоустойчивости компонентов продукта. Для этих целей в продукт были внедрены средства мониторинга, сбора логов и трейсов, а также визуализация и алертинг, которые позволяют отслеживать внутреннее состояние компонентов продукта и сигнализизировать в случае возникновения аномальных ситуаций. В данном направлении команда непосредственно занимается деплоем, оптимизацией компонентов observability, созданием дашбордов, алертов, построением отказоустойчивой инфраструктуры в области observability.

Чем предстоит заниматься:

  • Повышать надежность, наблюдаемость компонентов продукта;
  • Автоматизация работ по развертыванию и обновлению компонентов, связанных с наблюдаемостью системы;
  • Проектировать, внедрять и поддерживать метрики, alerts, dashboards в актуальном состоянии;
  • Проектировать и внедрять отказоустойчивую архитектуру компонентов продукта;
  • Взаимодействовать с командой разработчиков, участвовать в процессах ревью продуктовых требований.

Что мы требуем от будущего члена команды:

  • Опыт работы с операционной системой Linux на уровне администратора;
  • Опыт работы с системами мониторинга Prometheus/VictoriaMetrics, визуализации данных с помощью Grafana;
  • Опыт работы с системами сбора и хранения логов/трейсов;
  • Опыт работы с Ansible;
  • Знание одного или нескольких скриптовых языков Python/Bash;
  • Понимание принципов построения отказоустойчивых систем.

Будет плюсом:

  • Опыт работы с базой данных Clickhouse;
  • Опыт работы с OpenTelemetry Collector.
месяц назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
250 091 - 385 975 руб.
  • ТН Цифровая Логистика
  • Москва
... своих бизнес-критических задач. =============================== Приглашаем специалиста по информационной безопасности и защите ... -инфраструктурой совместно с DevOps и SRE специалистами. ** Дополнительные задачи (30% времени): ** Участие ...
12.01.2026
250 091 - 385 975 руб.
  • МТС
  • Москва
... инфраструктуры; Глубокое понимание архитектуры телеком-инфраструктуры оператора, интеграции систем ... CKAD (Kubernetes), Google Professional SRE; Приветствуется знание отраслевых стандартов ... , eTOM, TM Forum, SRE principles); Будет плюсом понимание нормативной ...
13.01.2026
  • Navio
  • Москва
Описание Компания Navio ищет хорошего специалиста на вакансию SRE-инженер . Москва (Россия). Полный ... и IT-компаний. Больше 800 специалистов каждый день работают над тем ... от кандидата Глубокое понимание принципов SRE и культуры надежности; Подтвержденный опыт ...
08.01.2026