Локация

ML-инженер в команду эффективного рантайма и инференса

Т-Банк
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Наша команда оптимизирует инференс нейросетевых моделей. Мы начинали с голосовых технологий и смогли заметно улучшить throughput и latency. Теперь мы развиваем решения для NLP, LLM, CV и других направлений.
Наша цель сделать так, чтобы использовать передовые модели в продуктах компании можно было быстро и эффективно.

Как мы работаем:

  • Делимся опытом во всех областях ML: CV, NLP, RecSys, Speech. Проводим внутренние семинары и обсуждаем последние новости AI.
  • Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
  • Развиваем в МФТИ лабораторию, с которой можно и нужно делать коллаборации.
  • Выстраиваем процессы и используем инфраструктуру компании, при этом минимизируем бюрократию.
  • Фокусируемся на принципе AI-first.
  • Не копим легаси.
  • Оплачиваем участие в топовых AI-конференциях 2 3 раза в год.

Обязанности

  • Оптимизировать производительность моделей машинного обучения для архитектур GPU
  • Работать с фреймворками для ускорения вычислений и развертывания нейросетей
  • Писать производительный низкоуровневый код на C++, оптимизированный под GPU с использованием CUDA

Требования

  • У вас есть опыт разработки ML-моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене
  • Хорошо понимаете современных DL-архитектур, знание методов оптимизации инференса
  • Работали с TensorRT, TRT-LLM, Triton Inference Server и другими инструментами ускорения моделей
  • Будет плюсом, если у вас есть опыт интеграции open-source-фреймворков, разработки высоконагруженных приложений на C/C++

Мы предлагаем:

  • Возможность работать с SOTA-моделями в разных сферах с настоящим бизнес-применением, доступ к современным вычислительным ресурсам, развитие и обучение новым технологиям
  • Работу в офисе или удаленно по договоренности
  • Платформу обучения и развития Т Банк Апгрейд . Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии
  • Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким
  • Возможность работы в аккредитованной ИТ-компании
  • Линейку льготных тарифов на продукты Т Банка
  • Частичную компенсацию затрат на спорт
  • Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам
  • Три дополнительных дня отпуска в год
  • Достойную зарплату обсудим ее на собеседовании
месяц назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • VK
  • Москва
... скорости (latency) и памяти для работы в продакшен-окружении Внедрение в production: взаимодействие ... Требования 2+ года опыта в Computer Vision и Deep Learning, твёрдое ... LLaVA, Qwen-VL) Опыт оптимизации инференса: квантизация, TensorRT/Triton, ONNX, CUDA ...
12.01.2026
  • Банк ДОМ.РФ
  • Москва
... ЗАНИМАТЬСЯ: Настраивать и поддерживать инфраструктуру для data-плафтормы в продакшене с высокой ... мониторинг и оптимизацию инфраструктуры НАШИ ПОЖЕЛАНИЯ К КАНДИДАТУ: Опыт работы DevOps-инженером ... , памяти Опыт настройки CI/CD в Gitlab Опыт работы с Zabbix ...
13.01.2026
  • Циан
  • Москва
... стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес ... с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе кухни ...
25.12.2025