Локация

LLM Platform Engineer (ASC AI Fabrique)

СБЕР
Самара Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.

Обязанности

  • развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • организация MLOps-процессов и системная оценка качества моделей
  • обеспечение production latency <2s и uptime >95% для инфраструктуры inference
  • профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • мониторинг GPU-производительности.

Требования

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • знание оптимизаций Flash Attention и Paged Attention
  • навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)

Будет плюсом:

  • опыт развертывания моделей на multi-GPU
  • практика профилирования VRAM usage в production-средах
  • опыт работы с моделями 480B+ параметров на кластерах GPU
  • знание специфических GPU scheduling инструментов (Volcano, Kueue).

Условия

  • комфортный офис, формат работы - гибрид
  • уникальная система обучения Сбера для профессионального и карьерного развития, семинары, тренинги, конференции
  • программа адаптации и помощь руководителя на старте
  • ДМС, страхование от несчастных случаев, социальные гарантии
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа
  • корпоративные мероприятия.
11 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • Magenta Technology
  • Самара
... вакансия LLM Platform Engineer (ML Engineer) на проект финтех. Задачи: Развертывание и оптимизация LLM моделей ... Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей Опыт ...
23.12.2025
  • Mercury Development
  • Самара
... for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in ... , develop, and customize the AOSP platform for Android 6, Android 10 ... enhance system performance and resolve platform issues. Customize Android s power ...
26.12.2025
  • Magenta Technology
  • Самара
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для трансформации метаблоков в исполняемый код Обеспечение ...
23.12.2025