LLM Platform/ML Ops Engineer (ASC AI Fabrique)
СБЕРОписание
ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.
Обязанности
- развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- организация MLOps-процессов и системная оценка качества моделей
- обеспечение production latency <2s и uptime >95% для инфраструктуры inference
- профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- мониторинг GPU-производительности.
Требования
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- знание оптимизаций Flash Attention и Paged Attention
- навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA).
Будет плюсом:
- опыт развертывания моделей на multi-GPU
- практика профилирования VRAM usage в production-средах
- опыт работы с моделями 480B+ параметров на кластерах GPU
- знание специфических GPU scheduling инструментов (Volcano, Kueue).
Условия
- стабильный оклад и социальная поддержка сотрудников
- расширенный ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- корпоративная пенсионная программа
- корпоративное обучение за счет компании
- реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 40 тыс. рублей
- официальное оформление с первого дня
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
- работу по Agile с лучшими из IT индустрии: 2000 продуктовых команд и возможность внутреннего перемещения.
8 дней назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Описание Мы в поиске AI Code Generation Engineer (Senior ML Engineer) на проект ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, ...
16.12.2025
Описание LLM Platform - это набор инструментов для ... для создания AI-ассистентов, не требующий глубокого погружения в LLM. В ... Банка и от внешних провайдеров. LLM Platform в цифрах: 40+ команд ... , которые основаны на ML-моделях и LLM Работать над проектами от ...
18.12.2025
... ) на платформе n8n, интегрирующих AI-сервисы и корпоративные системы. Проектирование ... по возможностям автоматизации с использованием AI. Требования: Опыт коммерческой ... модели). Понимание принципов работы с LLM: построение эффективных промптов, управление ...
18.12.2025