Локация

Работа "ml lead (llm/rag)" в Москве (133 вакансии)

Сортировать:
  • СБЕР
  • Москва
... сопровождение моделей: Classic ML, NLP (tf-idf, BERT, LLM fine-tuning, prompt ... в разработке агентных систем, понимание RAG, LLM-as-judge, MCP; опыт работы ... и фреймворками для работы с LLM (LangChain, LangGraph, n8n, etc); опыт ...
13.01.2026
  • ФосАгро
  • Москва
... production-сервисов в области NLP/LLM. LLM в проде: понимание токенизации/контекста ... оценивать влияние на качество/производительность. RAG / knowledge Q&A: практический ... или аналоги: интеграция с retrieval/RAG и логированием. Workflow orchestration: Temporal ...
12.01.2026
  • СБЕР
  • Москва
... -оберток для API продуктовых фабрик, RAG и интеграцию с системой управления ... всё метриками интерес к LLM или классическому ML и есть опыт разработки ... таких решений опыт инференса LLM моделей ...
13.01.2026
  • SberTech
  • Москва
... AI систем в ПРОД (Classic ML, RAG, Agents) опыт оценки работы AI ... повышения ее качества знание классического ML и NLP (NER, классификация, суммаризация ... . знание фреймворков для работы с LLM (LangChain/GigaChain, LangServe/GigaServe, LlamaIndex ...
12.01.2026
  • СБЕР
  • Москва
... Опыт разработки решений с использованием LLM (Python, генерация гипотез, построение ... на основе LLM) Опыт разработки решений с использованием RAG / agentic RAG Опыт ... разработки решений с агентской логикой Дообучение LLM ( ...
12.01.2026
  • Яндекс
  • Москва
... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...
25.12.2025
  • РУСАЛ
  • Москва
... Разработка и внедрение LLM-агентов и продвинутых RAG-систем для решения ... отчетности с использованием AI-ассистентов (RAG-пайплайны, классификация запросов, генерация ... архитектуры LLM и принципов prompt engineering. Практический опыт построения RAG-систем ...
12.01.2026
  • Яндекс
  • Москва
... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...
25.12.2025
  • Яндекс
  • Москва
... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...
12.01.2026
  • АРЕАЛ
  • Москва
... конвейере: Выявление возможностей применения LLM в различных бизнес-процессах компании ... LlamaIndex для создания LLM-приложений Умение интегрировать LLM с внешними ... RAG (Retrieval-Augmented Generation) Желательные навыки: Опыт работы с open-source LLM ...
12.01.2026
  • Звук
  • Москва
... продаж, обработки аудиоконтента, исполнения LLM: среды разработки, тестирования, инференса ... LLMOps-практик (эффективный инференс LLM для ChatGPT-like решений); ... умение разбираться в ML-алгоритмах (бустинги, сетки, LLM, распределённые вычисления); Знание ...
25.12.2025
  • FIX PRICE
  • Москва
... обучения: Проведение экспериментов с различными ML моделями, анализ их производительности и ... . Будет преимуществом: Опыт работы с LLM, включая OpenAI, Claude и DeepSeek ... передачи данных; Знания в области RAG-систем: опыт построения полного пайплайна ...
13.01.2026
  • Топассистент
  • Москва
... оптимизация моделей (обеспечение ML production), дистилляция, прунинг. Работать с LLM: тонкая настройка ... Ray Serve, Ray cluster, TensorRT-LLM. Обеспечение мониторинга: Grafana. Разработка бэкенда ... Подтвержденный опыт работы с моделями LLM, TTS, STT и другими ...
11.01.2026
от 350 000 руб.
  • Думатель
  • Москва
... система с мультиагентной архитектурой и RAG-подходом , которая помогает ... потоков данных. Интеграция с ML и аналитикой работа с ... готовыми ML-модулями для прогнозирования, но ... Будет большим плюсом: Интеграция ML-модулей в продакшн (но ...
13.01.2026
от 350 000 руб.
  • НРК - Р.О.С.Т.
  • Москва
... взаимодействия с LLM (GPT, Yandex GPT и др.) Реализация RAG-систем (Retrieval ... Требования: Понимание принципов работы LLM и RAG Опыт работы с JSON, XML ... ассистент для акционеров Чат-бот, RAG на основе правил и регламентов ...
12.01.2026
  • СБЕР
  • Москва
... решать существующие задачи с помощью RAG. Вы будете: заниматься ... фреймворков для работы с RAG и LLM в целом влияет на ... , обработки и использования для RAG проектировать и реализовывать хранилища, ... решать задачи, связанные с RAG применять машинное обучение и ...
25.12.2025
  • Lamoda Tech
  • Москва
... этого мы активно развиваем применения LLM в различных задачах Lamoda ... metric learning; Опыт вывода ML-моделей в прод для решения ... -кластеру; Код с логикой ML-пайплайнов упаковываем в Docker и ... ; Используем Airflow для управления ML-пайплайнами и запуском их по ...
22.12.2025
  • Первый Бит
  • Москва
... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...
25.12.2025
  • СБЕР
  • Москва
... решать существующие задачи с помощью RAG. Вы будете: заниматься ... фреймворков для работы с RAG и LLM в целом влияет на ... , обработки и использования для RAG проектировать и реализовывать хранилища, ... решать задачи, связанные с RAG применять машинное обучение и ...
25.12.2025
  • Первый Бит
  • Москва
... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...
13.01.2026
  • Americor Funding Inc
  • Москва
... и возможностях. Используем LLM для классификации и RAG для формирования ответов клиентам ... на нём Понимание RAG-архитектур, основ взаимодействия с LLM Продуктовый взгляд: понимание ...
12.01.2026
  • Первый Бит
  • Москва
... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...
11.01.2026
  • red mad robot
  • Москва
... который будет развивать наши LLM. Что предстоит делать: Прототипировать ... При необходимости интегрировать облачные LLM через API. От тебя: ... проектах. Опыт работы с LLM, знание техник prompt engineering, ... vLLM, опыт работы с RAG. Желание изучать новые подходы, ...
12.01.2026
  • СОГАЗ
  • Москва
... нуля; Взаимодействие с командой ML-инженеров; Интеграция сервиса с ... общее понимание устройства ML и знаете современные LLM модели; Имеете ... Имеете опыт интеграции с ML-сервисами или API-интерфейсами; ... Будет плюсом: Опыт работы с LLM (например, OpenAI, Mistral, ...
25.12.2025
  • Go Offer
  • Москва
... (динамика и статика); интеграция LLM (агенты, RAG). Разрабатывать frontend на React: формы ... . AI: LangChain, LangGraph; понимание агентов, RAG и потоковой генерации. Frontend (React ...
13.01.2026