Локация

LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

Салют для Бизнеса
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера , мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.

Обязанности:

  • Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
  • Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
  • Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
  • Настраивать и оптимизировать векторный и гибридный поиск
  • Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
  • Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
  • Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
  • Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
  • Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

  • Опыт работы от 3х лет
  • Опыт работы с AI инструментами: от года
  • Опыт создания RAG-систем
  • Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
  • Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
  • LangChain, LlamaIndex
  • LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
  • Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
  • Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
  • Embedding-модели: e5, bge, multilingual-e5
  • Python, Git, Docker, docker-compose
  • PostgreSQL, Redis
  • Методы оценки: hit rate, RAGAS, human evaluation
  • Способность объяснить принятые технические решения и их trade-offs

Условия

  • достойная заработная плата + годовой бонус
  • сильная команда
  • ДМС, с первого рабочего дня
  • работа в аккредитованной IT компании
  • льготная ипотека от Сбера
  • локация: Москва, м. Цветной бульвар.
6 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • Салют для Бизнеса
  • Москва
... Описание Мы - команда Giga B2B (ООО Салют для бизнеса ) , дочерняя организация ... полный цикл решений: LLM-модель GigaChat для ... погружение в современный AI-стек технологий: большие ... лет Уверенный уровень Middle+ и выше ... A2A Опыт построения RAG систем - работа с ...
27.12.2025
  • Салют для Бизнеса
  • Москва
... Описание Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера , ... маржинальность. Себестоимость облака и LLM (токены/инференс), GPU/ ... лет в финансах, включая B2B SaaS и/или вендорскую ... cloud/FinOps и экономики AI-инференса/LLM (GPU, токены, потоки ...
27.12.2025
  • Салют для Бизнеса
  • Москва
... Мы - команда ООО "Салют для бизнеса" , дочерняя организация Сбера ... полный цикл решений: LLM-модель GigaChat для локальной ... . Участие в проведении AI-Sprint/обследований: интервью, ... пользовательских. Умение переводить бизнес-задачи в формализованные требования ...
28.12.2025