LLM Platform Engineer (ML Engineer)
Magenta TechnologyОписание
Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех.
Задачи:
- Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- Организация MLOps-процессов и системная оценка качества моделей
- Обеспечение production latency <2s и uptime >95% для инфраструктуры inference
- Профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- Мониторинг GPU-производительности
Мы ожидаем от тебя:
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- Опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- Знание оптимизаций Flash Attention и Paged Attention
- Навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- Опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)
Будет плюсом:
- Опыт развертывания моделей на multi-GPU
- Практика профилирования VRAM usage в production-средах
- Опыт работы с моделями 480B+ параметров на кластерах GPU
- Знание специфических GPU scheduling инструментов (Volcano, Kueue)
23 часа назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для трансформации метаблоков в исполняемый код Обеспечение ...
23.12.2025
... for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in ... , develop, and customize the AOSP platform for Android 6, Android 10 ... enhance system performance and resolve platform issues. Customize Android s power ...
22.12.2025
70 000 - 100 000 руб.
... и жёсткими сроками. Кого ищем ML / AI инженера, который хочет ... месяцев: Разобраться в текущем ML-контуре Gideone (Python, внутренние ... ошибки) поэтапно. Вести полный ML-цикл : данные обучение валидация ... уверенный уровень. Опыт в ML/DL: PyTorch или TensorFlow. ...
21.12.2025