Site Reliability Engineer (SRE)
BetBoomОписание
Мы динамично растущая технологическая компания, и наш продукт - это сложная высоконагруженная система, обрабатывающая большие объемы данных.
Мы ищем опытного и инициативного SRE-инженера, который готов присоединиться к нашей сильной Ops-команде и вместе с нами обеспечивать бесперебойную работу и развитие нашей платформы.
Чем вы будете заниматься:
- Обеспечение стабильности, доступности и отказоустойчивости production-окружения совместно с командами разработки.
- Развитие и поддержка системы observability на основе современного стека (Victoriametrics, Grafana, Tempo, Elasticsearch, Pyroscope, Sentry) для полного контроля над системой.
- Оперативное участие в инцидентах: диагностика, устранение, последующий разбор и реализация мер по предотвращению их повторения.
- Построение и отладка процессов инцидент-менеджмента.
- Автоматизация и развитие инфраструктуры.
- Разработка автоматизаций для устранения рутины и повышения надежности (преимущественно на Go).
Наш технологический стек:
- Инфраструктура: Managed Kubernetes, GCP, Yandex Cloud, Selectel.
- Сети: Cloud, Cilium, Linkerd (Service Mesh).
- Observability: Victoriametrics, Grafana, Tempo, Elasticsearch, OTLP, Pyr-oscope, Sentry.
- IaaC & CI/CD: Terraform, Terragrunt, Ansible (минимально), GitLab CI.
- Сервисы и БД: Node.js, Go (HTTP/gRPC), PostgreSQL (CloudNative-PG), ClickHouse, RabbitMQ, Redis.
- Автоматизации: Внутренние инструменты на Go.
Мы ищем специалиста, который:
- Имеет опыт работы SRE/DevOps в высоконагруженных production-средах.
- Обладает глубоким пониманием Kubernetes и опыт отладки приложений в нем.
- Имеет практический опыт построения и использования систем observability (мониторинг, логи, трейсинг).
- Понимает принципы сетевого взаимодействия, работы протоколов (HTTP/gRPC) и уметь диагностировать проблемы на этом уровне.
- Имеет базовые навыки программирования на Go для создания автоматизаций.
- Понимает жизненный цикл и особенности работы реляционных и нереляционных СУБД (PostgreSQL, ClickHouse).
- Обязательно умеет работать самостоятельно, генерировать задачи и проактивно решать проблемы. Не ждет готовых ТЗ.
7 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
... мобильное приложение. Сейчас мы ищем Site Reliability Engineer (SRE) , который будет отвечать за стабильность ... ); Опыт работы в роли SRE / DevOps / Infrastructure Engineer от 3 лет; Отличное ...
16.12.2025
... и развитии внутренней платформы Тесно взаимодействовать с backend и platform-командами Ваш профиль: Обязательно: Опыт работы DevOps Engineer / SRE от 2 3 лет Глубокое понимание Linux, сетей и distributed-систем Практический опыт с Kubernetes (deployments ...
08.01.2026
... в поиске сильного Senior DevOps / SRE, который возьмёт на себя построение ... : - Уровень Middle+ / Senior DevOps или SRE - Сильный Linux (администрирование, а не ...
06.01.2026