Ml lead (llm/rag) работа в Москве

СБЕР
Москва

... сопровождение моделей: Classic ML, NLP (tf-idf, BERT, LLM fine-tuning, prompt ... в разработке агентных систем, понимание RAG, LLM-as-judge, MCP; опыт работы ... и фреймворками для работы с LLM (LangChain, LangGraph, n8n, etc); опыт ...

13.01.2026

AI Engineer

ФосАгро
Москва

... production-сервисов в области NLP/LLM. LLM в проде: понимание токенизации/контекста ... оценивать влияние на качество/производительность. RAG / knowledge Q&A: практический ... или аналоги: интеграция с retrieval/RAG и логированием. Workflow orchestration: Temporal ...

12.01.2026

AI Agent Developer (Data Engineering + Data Science)

СБЕР
Москва

... -оберток для API продуктовых фабрик, RAG и интеграцию с системой управления ... всё метриками интерес к LLM или классическому ML и есть опыт разработки ... таких решений опыт инференса LLM моделей ...

13.01.2026

Data Scientist(Sberspace)

SberTech
Москва

... AI систем в ПРОД (Classic ML, RAG, Agents) опыт оценки работы AI ... повышения ее качества знание классического ML и NLP (NER, классификация, суммаризация ... . знание фреймворков для работы с LLM (LangChain/GigaChain, LangServe/GigaServe, LlamaIndex ...

12.01.2026

Data Scientist в Центр AI-маркетинга

СБЕР
Москва

... Опыт разработки решений с использованием LLM (Python, генерация гипотез, построение ... на основе LLM) Опыт разработки решений с использованием RAG / agentic RAG Опыт ... разработки решений с агентской логикой Дообучение LLM ( ...

12.01.2026

Старший разработчик в группу GPU-инфраструктуры

Яндекс
Москва

... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...

25.12.2025

Senior Data Scientist

РУСАЛ
Москва

... Разработка и внедрение LLM-агентов и продвинутых RAG-систем для решения ... отчетности с использованием AI-ассистентов (RAG-пайплайны, классификация запросов, генерация ... архитектуры LLM и принципов prompt engineering. Практический опыт построения RAG-систем ...

12.01.2026

Старший разработчик в группу GPU-инфраструктуры

Яндекс
Москва

... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...

25.12.2025

Старший разработчик в группу GPU-инфраструктуры

Яндекс
Москва

... GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса ... внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: Оператор для ... инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие Разрабатывали ...

12.01.2026

Prompt Engineer

АРЕАЛ
Москва

... конвейере: Выявление возможностей применения LLM в различных бизнес-процессах компании ... LlamaIndex для создания LLM-приложений Умение интегрировать LLM с внешними ... RAG (Retrieval-Augmented Generation) Желательные навыки: Опыт работы с open-source LLM ...

12.01.2026

Senior MLOps Engineer

Звук
Москва

... продаж, обработки аудиоконтента, исполнения LLM: среды разработки, тестирования, инференса ... LLMOps-практик (эффективный инференс LLM для ChatGPT-like решений); ... умение разбираться в ML-алгоритмах (бустинги, сетки, LLM, распределённые вычисления); Знание ...

25.12.2025

Python-разработчик

FIX PRICE
Москва

... обучения: Проведение экспериментов с различными ML моделями, анализ их производительности и ... . Будет преимуществом: Опыт работы с LLM, включая OpenAI, Claude и DeepSeek ... передачи данных; Знания в области RAG-систем: опыт построения полного пайплайна ...

13.01.2026

Senior NLP Engineer

Топассистент
Москва

... оптимизация моделей (обеспечение ML production), дистилляция, прунинг. Работать с LLM: тонкая настройка ... Ray Serve, Ray cluster, TensorRT-LLM. Обеспечение мониторинга: Grafana. Разработка бэкенда ... Подтвержденный опыт работы с моделями LLM, TTS, STT и другими ...

11.01.2026

Senior Python разработчик

от 350 000 руб.

Думатель
Москва

... система с мультиагентной архитектурой и RAG-подходом , которая помогает ... потоков данных. Интеграция с ML и аналитикой работа с ... готовыми ML-модулями для прогнозирования, но ... Будет большим плюсом: Интеграция ML-модулей в продакшн (но ...

13.01.2026

от 350 000 руб.

Специалист по искуственному интеллекту

НРК - Р.О.С.Т.
Москва

... взаимодействия с LLM (GPT, Yandex GPT и др.) Реализация RAG-систем (Retrieval ... Требования: Понимание принципов работы LLM и RAG Опыт работы с JSON, XML ... ассистент для акционеров Чат-бот, RAG на основе правил и регламентов ...

12.01.2026

Data engineer

СБЕР
Москва

... решать существующие задачи с помощью RAG. Вы будете: заниматься ... фреймворков для работы с RAG и LLM в целом влияет на ... , обработки и использования для RAG проектировать и реализовывать хранилища, ... решать задачи, связанные с RAG применять машинное обучение и ...

25.12.2025

Data Scientist (Deep Learning / RecSys)

Lamoda Tech
Москва

... этого мы активно развиваем применения LLM в различных задачах Lamoda ... metric learning; Опыт вывода ML-моделей в прод для решения ... -кластеру; Код с логикой ML-пайплайнов упаковываем в Docker и ... ; Используем Airflow для управления ML-пайплайнами и запуском их по ...

22.12.2025

Разработчик платформы GenAI (Middle Backend Engineer)

Первый Бит
Москва

... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...

25.12.2025

Senior Data Engineer

СБЕР
Москва

... решать существующие задачи с помощью RAG. Вы будете: заниматься ... фреймворков для работы с RAG и LLM в целом влияет на ... , обработки и использования для RAG проектировать и реализовывать хранилища, ... решать задачи, связанные с RAG применять машинное обучение и ...

25.12.2025

Разработчик платформы GenAI (Senior Backend Engineer)

Первый Бит
Москва

... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...

13.01.2026

Middle+/Senior PHP Developer (Salesrep.ai)

Americor Funding Inc
Москва

... и возможностях. Используем LLM для классификации и RAG для формирования ответов клиентам ... на нём Понимание RAG-архитектур, основ взаимодействия с LLM Продуктовый взгляд: понимание ...

12.01.2026

Backend Engineer

Первый Бит
Москва

... GenAI-функциональность: Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат ... , функции-вызовы, стриминг токенов RAG-пайплайн: загрузка и нарезка документов ... проде. Будет плюсом Опыт построения RAG-систем, знание LangChain/LlamaIndex или ...

11.01.2026

NLP engineer

red mad robot
Москва

... который будет развивать наши LLM. Что предстоит делать: Прототипировать ... При необходимости интегрировать облачные LLM через API. От тебя: ... проектах. Опыт работы с LLM, знание техник prompt engineering, ... vLLM, опыт работы с RAG. Желание изучать новые подходы, ...

12.01.2026

Middle Python-разработчик AI-агентов (команда Жизнь - развитие продуктов)

СОГАЗ
Москва

... нуля; Взаимодействие с командой ML-инженеров; Интеграция сервиса с ... общее понимание устройства ML и знаете современные LLM модели; Имеете ... Имеете опыт интеграции с ML-сервисами или API-интерфейсами; ... Будет плюсом: Опыт работы с LLM (например, OpenAI, Mistral, ...

25.12.2025

Fullstack разработчик (Python / React, AI-продукт)

Go Offer
Москва

... (динамика и статика); интеграция LLM (агенты, RAG). Разрабатывать frontend на React: формы ... . AI: LangChain, LangGraph; понимание агентов, RAG и потоковой генерации. Frontend (React ...

13.01.2026

Работа "ml lead (llm/rag)" в Москве (133 вакансии)