Инженер техподдержки L2
Cloud.ruОписание
Ведется набор в команду технической поддержки (L2), специализация на одном из трёх направлений:
На этой позиции тебе предстоит:
1. Distributed Train :
- Поддержка инфраструктуры распределённого обучения (Jupyter, Triton, CUDA, NCCL);
- Работа с Kubernetes и Docker-контейнерами; Диагностика ошибок в пайплайнах и окружениях;
- Взаимодействие с командами разработки при возникновении инцидентов.
2. Evolution Compute (облачная IaaS-инфраструктура):
- Диагностика и устранение инцидентов на базе OpenStack;
- Поддержка виртуальных машин, сетей и сопутствующих сервисов;
- Проведение регламентных работ и участие в модернизации платформы;
- Работа с системами мониторинга и SQL-запросами.
3. Облачная платформа и Личный кабинет:
- Поддержка пользовательского интерфейса и API;
- Анализ HAR-логов, проблем с авторизацией, доступами и биллингом;
- Работа с запросами пользователей, техническая диагностика ошибок UI/UX;
- Взаимодействие с командами backend/frontend-разработки.
Что мы ждем от кандидата:
Distributed Train:
Знание Linux на уровне администратора;
Опыт работы с Kubernetes и Docker;
SQL (PostgreSQL);
Опционально: Python, Bash. Evolution Compute:
Evolution Compute:
Опыт или желание работать с OpenStack;
Linux (сетевые подсистемы, виртуализация);
SQL;
Опционально: Bash, опыт работы с мониторингом (Zabbix, Grafana).
Личный кабинет / Облачная платформа:
SQL, понимание REST API;
Навыки анализа HAR-логов, работы с браузерной консолью;
Владение Git;
Linux на уровне пользователя или администратора;
Опционально: Bash.
На всех трех направлениях - готовность работать в графике 2-2-2 (дневные и ночные смены)