Главная
Работа в Москве
LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

Салют для Бизнеса

Москва Опыт работы от 3 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера , мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.

Обязанности:

Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
Настраивать и оптимизировать векторный и гибридный поиск
Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

Опыт работы от 3х лет
Опыт работы с AI инструментами: от года
Опыт создания RAG-систем
Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
LangChain, LlamaIndex
LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
Embedding-модели: e5, bge, multilingual-e5
Python, Git, Docker, docker-compose
PostgreSQL, Redis
Методы оценки: hit rate, RAGAS, human evaluation
Способность объяснить принятые технические решения и их trade-offs

Условия

достойная заработная плата + годовой бонус
сильная команда
ДМС, с первого рабочего дня
работа в аккредитованной IT компании
льготная ипотека от Сбера
локация: Москва, м. Цветной бульвар.

Откликнуться

6 часов назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Senior/Middle Python разработчик (Giga B2B "Салют для Бизнеса")

Салют для Бизнеса
Москва

... Описание Мы - команда Giga B2B (ООО Салют для бизнеса ) , дочерняя организация ... полный цикл решений: LLM-модель GigaChat для ... погружение в современный AI-стек технологий: большие ... лет Уверенный уровень Middle+ и выше ... A2A Опыт построения RAG систем - работа с ...

27.12.2025

Финансовый директор (Giga B2B "Салют для Бизнеса")

Салют для Бизнеса
Москва

... Описание Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера , ... маржинальность. Себестоимость облака и LLM (токены/инференс), GPU/ ... лет в финансах, включая B2B SaaS и/или вендорскую ... cloud/FinOps и экономики AI-инференса/LLM (GPU, токены, потоки ...

27.12.2025

Бизнес-аналитик (Giga B2B "Салют для Бизнеса")

Салют для Бизнеса
Москва

... Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера ... полный цикл решений: LLM-модель GigaChat для локальной ... . Участие в проведении AI-Sprint/обследований: интервью, ... пользовательских. Умение переводить бизнес-задачи в формализованные требования ...

28.12.2025

Посмотреть все похожие вакансии