Главная
Работа в Москве
Site Reliability Engineer (SRE)

Site Reliability Engineer (SRE)

BetBoom

Москва Опыт работы от 6 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

Мы динамично растущая технологическая компания, и наш продукт - это сложная высоконагруженная система, обрабатывающая большие объемы данных.
Мы ищем опытного и инициативного SRE-инженера, который готов присоединиться к нашей сильной Ops-команде и вместе с нами обеспечивать бесперебойную работу и развитие нашей платформы.

Чем вы будете заниматься:

Обеспечение стабильности, доступности и отказоустойчивости production-окружения совместно с командами разработки.
Развитие и поддержка системы observability на основе современного стека (Victoriametrics, Grafana, Tempo, Elasticsearch, Pyroscope, Sentry) для полного контроля над системой.
Оперативное участие в инцидентах: диагностика, устранение, последующий разбор и реализация мер по предотвращению их повторения.
Построение и отладка процессов инцидент-менеджмента.
Автоматизация и развитие инфраструктуры.
Разработка автоматизаций для устранения рутины и повышения надежности (преимущественно на Go).

Наш технологический стек:

Инфраструктура: Managed Kubernetes, GCP, Yandex Cloud, Selectel.
Сети: Cloud, Cilium, Linkerd (Service Mesh).
Observability: Victoriametrics, Grafana, Tempo, Elasticsearch, OTLP, Pyr-oscope, Sentry.
IaaC & CI/CD: Terraform, Terragrunt, Ansible (минимально), GitLab CI.
Сервисы и БД: Node.js, Go (HTTP/gRPC), PostgreSQL (CloudNative-PG), ClickHouse, RabbitMQ, Redis.
Автоматизации: Внутренние инструменты на Go.

Мы ищем специалиста, который:

Имеет опыт работы SRE/DevOps в высоконагруженных production-средах.
Обладает глубоким пониманием Kubernetes и опыт отладки приложений в нем.
Имеет практический опыт построения и использования систем observability (мониторинг, логи, трейсинг).
Понимает принципы сетевого взаимодействия, работы протоколов (HTTP/gRPC) и уметь диагностировать проблемы на этом уровне.
Имеет базовые навыки программирования на Go для создания автоматизаций.
Понимает жизненный цикл и особенности работы реляционных и нереляционных СУБД (PostgreSQL, ClickHouse).
Обязательно умеет работать самостоятельно, генерировать задачи и проактивно решать проблемы. Не ждет готовых ТЗ.

Откликнуться

7 часов назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Site Reliability Engineer (SRE)

Finstar Financial Group
Москва

... мобильное приложение. Сейчас мы ищем Site Reliability Engineer (SRE) , который будет отвечать за стабильность ... ); Опыт работы в роли SRE / DevOps / Infrastructure Engineer от 3 лет; Отличное ...

16.12.2025

DevOps Engineer / Site Reliability Engineer (SRE)

Kameleoon
Москва

... и развитии внутренней платформы Тесно взаимодействовать с backend и platform-командами Ваш профиль: Обязательно: Опыт работы DevOps Engineer / SRE от 2 3 лет Глубокое понимание Linux, сетей и distributed-систем Практический опыт с Kubernetes (deployments ...

08.01.2026

Senior DevOps / Site Reliability Engineer, SRE

Нейротехнологии
Москва

... в поиске сильного Senior DevOps / SRE, который возьмёт на себя построение ... : - Уровень Middle+ / Senior DevOps или SRE - Сильный Linux (администрирование, а не ...

06.01.2026

Посмотреть все похожие вакансии