ML-инженер в команду эффективного рантайма и инференса
Т-БанкОписание
Наша команда оптимизирует инференс нейросетевых моделей. Мы начинали с голосовых технологий и смогли заметно улучшить throughput и latency. Теперь мы развиваем решения для NLP, LLM, CV и других направлений.
Наша цель сделать так, чтобы использовать передовые модели в продуктах компании можно было быстро и эффективно.
Как мы работаем:
- Делимся опытом во всех областях ML: CV, NLP, RecSys, Speech. Проводим внутренние семинары и обсуждаем последние новости AI.
- Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
- Развиваем в МФТИ лабораторию, с которой можно и нужно делать коллаборации.
- Выстраиваем процессы и используем инфраструктуру компании, при этом минимизируем бюрократию.
- Фокусируемся на принципе AI-first.
- Не копим легаси.
- Оплачиваем участие в топовых AI-конференциях 2 3 раза в год.
Обязанности
- Оптимизировать производительность моделей машинного обучения для архитектур GPU
- Работать с фреймворками для ускорения вычислений и развертывания нейросетей
- Писать производительный низкоуровневый код на C++, оптимизированный под GPU с использованием CUDA
Требования
- У вас есть опыт разработки ML-моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене
- Хорошо понимаете современных DL-архитектур, знание методов оптимизации инференса
- Работали с TensorRT, TRT-LLM, Triton Inference Server и другими инструментами ускорения моделей
- Будет плюсом, если у вас есть опыт интеграции open-source-фреймворков, разработки высоконагруженных приложений на C/C++
Мы предлагаем:
- Возможность работать с SOTA-моделями в разных сферах с настоящим бизнес-применением, доступ к современным вычислительным ресурсам, развитие и обучение новым технологиям
- Работу в офисе или удаленно по договоренности
- Платформу обучения и развития Т Банк Апгрейд . Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии
- Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким
- Возможность работы в аккредитованной ИТ-компании
- Линейку льготных тарифов на продукты Т Банка
- Частичную компенсацию затрат на спорт
- Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам
- Три дополнительных дня отпуска в год
- Достойную зарплату обсудим ее на собеседовании
месяц назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
... скорости (latency) и памяти для работы в продакшен-окружении Внедрение в production: взаимодействие ... Требования 2+ года опыта в Computer Vision и Deep Learning, твёрдое ... LLaVA, Qwen-VL) Опыт оптимизации инференса: квантизация, TensorRT/Triton, ONNX, CUDA ...
12.01.2026
... ЗАНИМАТЬСЯ: Настраивать и поддерживать инфраструктуру для data-плафтормы в продакшене с высокой ... мониторинг и оптимизацию инфраструктуры НАШИ ПОЖЕЛАНИЯ К КАНДИДАТУ: Опыт работы DevOps-инженером ... , памяти Опыт настройки CI/CD в Gitlab Опыт работы с Zabbix ...
13.01.2026
... стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес ... с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе кухни ...
25.12.2025