Главная
Работа в Москве
ML-инженер в команду эффективного рантайма и инференса

ML-инженер в команду эффективного рантайма и инференса

Т-Банк

Москва Опыт работы от 3 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

Наша команда оптимизирует инференс нейросетевых моделей. Мы начинали с голосовых технологий и смогли заметно улучшить throughput и latency. Теперь мы развиваем решения для NLP, LLM, CV и других направлений.
Наша цель сделать так, чтобы использовать передовые модели в продуктах компании можно было быстро и эффективно.

Как мы работаем:

Делимся опытом во всех областях ML: CV, NLP, RecSys, Speech. Проводим внутренние семинары и обсуждаем последние новости AI.
Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
Развиваем в МФТИ лабораторию, с которой можно и нужно делать коллаборации.
Выстраиваем процессы и используем инфраструктуру компании, при этом минимизируем бюрократию.
Фокусируемся на принципе AI-first.
Не копим легаси.
Оплачиваем участие в топовых AI-конференциях 2 3 раза в год.

Обязанности

Оптимизировать производительность моделей машинного обучения для архитектур GPU
Работать с фреймворками для ускорения вычислений и развертывания нейросетей
Писать производительный низкоуровневый код на C++, оптимизированный под GPU с использованием CUDA

Требования

У вас есть опыт разработки ML-моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене
Хорошо понимаете современных DL-архитектур, знание методов оптимизации инференса
Работали с TensorRT, TRT-LLM, Triton Inference Server и другими инструментами ускорения моделей
Будет плюсом, если у вас есть опыт интеграции open-source-фреймворков, разработки высоконагруженных приложений на C/C++

Мы предлагаем:

Возможность работать с SOTA-моделями в разных сферах с настоящим бизнес-применением, доступ к современным вычислительным ресурсам, развитие и обучение новым технологиям
Работу в офисе или удаленно по договоренности
Платформу обучения и развития Т Банк Апгрейд . Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии
Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким
Возможность работы в аккредитованной ИТ-компании
Линейку льготных тарифов на продукты Т Банка
Частичную компенсацию затрат на спорт
Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам
Три дополнительных дня отпуска в год
Достойную зарплату обсудим ее на собеседовании

Откликнуться

месяц назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

ML Engineer в команду компьютерного зрения и мультимодальных моделей в AI VK

VK
Москва

... скорости (latency) и памяти для работы в продакшен-окружении Внедрение в production: взаимодействие ... Требования 2+ года опыта в Computer Vision и Deep Learning, твёрдое ... LLaVA, Qwen-VL) Опыт оптимизации инференса: квантизация, TensorRT/Triton, ONNX, CUDA ...

12.01.2026

DevOps-инженер в команду Платформы данных и аналитические системы

Банк ДОМ.РФ
Москва

... ЗАНИМАТЬСЯ: Настраивать и поддерживать инфраструктуру для data-плафтормы в продакшене с высокой ... мониторинг и оптимизацию инфраструктуры НАШИ ПОЖЕЛАНИЯ К КАНДИДАТУ: Опыт работы DevOps-инженером ... , памяти Опыт настройки CI/CD в Gitlab Опыт работы с Zabbix ...

13.01.2026

ML Engineer в команду Вторички

Циан
Москва

... стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес ... с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе кухни ...

25.12.2025

Посмотреть все похожие вакансии