Локация

Работа "mlops (ml inference engineer)" в Москве (278 вакансий)

Сортировать:
  • Первый Бит
  • Москва
... в проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или аналогов. Работа с векторными БД (qdrant, pgvector, Pinecone) и эмбеддинг-моделями. Опыт со streaming inference (vLLM, ollama), очередями задач (Celery/Temporal)
29.12.2025
от 450 000 руб.
  • Gradient
  • Москва
... с большим количеством инстансов Деплой ML моделей Требования 3+ года коммерческого ... , продакшн-опыт. Terraform. Опыт деплоя ML-моделей в production. Глубокий опыт ...
28.12.2025
от 450 000 руб.
от 450 000 руб.
  • Gradient
  • Москва
... с большим количеством инстансов Деплой ML моделей Требования 3+ года коммерческого ... , продакшн-опыт. Terraform. Опыт деплоя ML-моделей в production. Глубокий опыт ...
28.12.2025
от 450 000 руб.
  • СБЕР
  • Москва
... python: модульный код, ООП, concurrency, pep, тесты понимание этапов обучения и современных архитектур LLM понимание методов оценки качества ML-систем глубокие теоретические знания в DL опыт отладки/обучения в multi-gpu режиме Будет плюсом опыт в Computer ...
25.12.2025
  • СБЕР
  • Москва
... python: модульный код, ООП, concurrency, pep, тесты хорошее знание алгоритмов и структур данных понимание методов оценки качества ML-систем глубокие теоретические знания в DL + опыт отладки/обучения (крайне желателен multi-gpu) знание современных подходов ...
25.12.2025
  • EmFi Technologies Limited
  • Москва
... motivated and talented Python/AI Engineer to join our dynamic, fast ... PyTorch, TensorFlow, Gym, or similar ML/RL frameworks. Reinforcement Learning: Understanding ...
25.12.2025
  • Selecty
  • Москва
... . - Умение писать SQL-запросы и работать с системами управления базами данных. - Опыт в разработке и внедрении ML-решений в производственную среду. - Отсутсвие ИП в IT - Требуется оконченное высшее образование по технической математической специальности ...
25.12.2025
  • Selecty
  • Москва
... , векторные БД. Опыт работы в ML/AI-инжиниринге от 3 лет ... принципов защиты данных и безопасных ML-процессов. Условия работы: Фиксированный график ...
25.12.2025
  • Компания БКС
  • Москва
... языковыми моделями и подключение RAG-профилей. Разработка ведется в кросс-функциональной команде: дизайнеры, аналитики, ML-инженеры, frontend и backend, тестировщики Чем предстоит заниматься: Проектированием и разработкой backend-архитектуры системы ...
24.12.2025
  • IT-hunters
  • Москва
Описание Мы ищем в нашу команду Middle/Senior ML-инженеров. У нас большая экспертиза в используемых технологиях и мало legacy. Мы любим свой код и поддерживаем его в актуальном состоянии. На проектах используем самые актуальные и современные технологии. ...
22.12.2025
  • СБЕР
  • Москва
... , knowledge distillation использование и доработка ML-компиляторов (TorchDyname, TorchInductor, TensorRT, и ... Python, PyTorch опыт работы с ML-компиляторами и оптимизацией инференса и ...
19.12.2025
  • Газпромбанк
  • Москва
... - это создание и эффективное внедрение ML моделей для решения бизнес - задач ... инженера данных, который поможет обеспечивать ML инженеров надёжными и качественными данными ...
18.12.2025
  • СБЕР
  • Москва
... Lead или углубляться в системный/ML-дизайн. современные процессы: последние версии ... . интерес к LLM или классическому ML и есть опыт разработки таких ...
18.12.2025
  • VK
  • Москва
Описание Ищем DWH Engineer для команды VK Видео одного из крупнейших и самых популярных видеосервисов в России! Задачи Разрабатывать и поддерживать процессы обработки и доставки данных для аналитических и ML команд Собирать витрины, оптимизировать Писать ...
17.12.2025
  • Ventra
  • Москва
... опыта работы SRE/DevOps/Platform Engineer. Свободное владение как минимум одним ... . Будет плюсом: Опыт работы с ML/данными или Superset, Airflow, Kafka ...
15.12.2025
  • Салют для Бизнеса
  • Москва
... контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках LangChain, LlamaIndex LLM-инференс: OpenAI API ...
29.12.2025
  • Первый Бит
  • Москва
... в проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или аналогов. Работа с векторными БД (qdrant, pgvector, Pinecone) и эмбеддинг-моделями. Опыт со streaming inference (vLLM, ollama), очередями задач (Celery/Temporal)
27.12.2025
  • Lamoda Tech
  • Москва
... , работу с поисковыми запросами и ML-модели (DL, NLP, CV). Обеспечивает ... производительностью; Взаимодействовать с аналитиками и ML-инженерами, оптимизировать SQL-запросы, развивать ...
26.12.2025
  • Aston
  • Москва
... Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом. Заказчик быстроразвивающаяся ИТ-компания, с ... ответственности команды. Чего мы ждем от специалиста? опыт работы в роли Big Data Engineer от 3-х лет; опыт работы в роли Tech Lead/Team Lead от 1 ...
25.12.2025
  • SSP SOFT
  • Москва
Описание Привет! Мы ищем в команду ML-Инженера / Python-разработчика уровня Senior. Для нас привлекательны следующие знания и опыт: Опыт коммерческой разработки на Python от 5 лет; Знание FastAPI или аналогичных async-фреймворков; Опыт работы с PostgreSQL ...
24.12.2025
  • Лао Оливарес Кристина Вячеславовна
  • Москва
... Retrieval-Augmented Generation (RAG) и AI Agents. Наши ожидания: 4 года коммерческого опыта в IT, 2+ года в ML/DS; Опыт работы с AI-агентами, RAG (Retrieval-Augmented Generation), фреймворками вроде LlamaIndex. Опыт работы с мультиагентной оркестрацией ...
23.12.2025
  • IT-hunters
  • Москва
Описание Мы ищем в нашу команду Middle/Senior ML-инженеров. У нас большая экспертиза в используемых технологиях и мало legacy. Мы любим свой код и поддерживаем его в актуальном состоянии. На проектах используем самые актуальные и современные технологии. ...
22.12.2025
  • VK
  • Москва
... L7-атак и исследование новых методов обнаружения угроз Требования Опыт в роли Machine Learning Engineer от трёх лет Уверенное знание Python и популярных ML-библиотек (PyTorch, TensorFlow, Scikit-learn) Навыки обработки и анализа данных Понимание принципов ...
19.12.2025
  • СБЕР
  • Москва
... вопросы, связанные с разворачиванием, настройкой и тонким тюнингом core Linux для обеспечения оптимальной работы inference-движков. Вместе мы будем заниматься построением инфраструктурного слоя для стратегических проектов крупнейшего банка РФ. Обязанности ...
16.12.2025
  • ФосАгро
  • Москва
... Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов. Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса. Условия: Удалённый формат работы ...
15.12.2025