Локация

Data Engineer (RAG / AI Platform)

Т-Банк
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных костылей.
Наша цель сделать RAG таким же привычным компонентом платформы, как SQL, Spark или CI/CD.
Для этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline от загрузки данных и чанкирования до метрик качества и retrival-механизмов. Дополнительным вызовом будет создание агентов для целей Data Platform используя RAG.

Задачи:

  • Проектировать и внедрять RAG-пайплайны уровня платформы: ingestion данных, чанкирование, эмбеддинги, retrival, оценка качества ответов.
  • Исследовать SOTA-методы RAG (chunking, reranking, hybrid retrival, eval frameworks RAGAS, TruLens, Langfuse, etc.) и адаптировать их под инфраструктуру Data / Dev Platform.
  • Создавать reusable компоненты (Python-библиотеки, API, Helm-чарты, шаблоны пайплайнов) для команд-потребителей.
  • Встраивать RAG в экосистему платформы: от self-service интерфейсов до observability и developer experience.
  • Разрабатывать метрики качества и мониторинг RAG-решений: faithfulness, groundedness, latency, coverage.
  • Агрегировать и распространять практики подготовки данных для использования в RAG.
  • Участвовать в воркшопах и кодлабах, обучать команды применению AI в продакшене.

Требования:

  • Уверенные знания Python, SQL.
  • Понимание архитектуры RAG-систем.
  • Опыт работы с LLM и embeddings OpenAI, Gemini, Mistral.
  • Опыт работы с Docker, Git, Linux, Bash, знание CI/CD.
  • Понимание общих принципов устройства СУБД (реляционных + NoSQL).
  • Знание подходов по организации ETL-процессов, инструментов построения ETL.

Будет плюсом:

  • Практический опыт с векторными БД (Milvus, Qdrant, FAISS, Chroma).
  • Понимание ML evaluation и метрик RAG-решений.
  • Опыт с LangChain / LlamaIndex .
  • Опыт построения retrival-и-eval pipelines в проде.
  • Знание Trino / ClickHouse / Greenplum / Spark как источников данных.
  • Понимание принципов System Design / архитектуры ML-платформ.
17 дней назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • Т-Банк
  • Москва
Описание Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики ... этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline от ...
29.12.2025
  • Лао Оливарес Кристина Вячеславовна
  • Москва
... процессов на Kanban-досках до AI-аналитики, которая предсказывает риски проектов ... на основе Retrieval-Augmented Generation (RAG) и AI Agents. Наши ожидания: 4 ... ML/DS; Опыт работы с AI-агентами, RAG (Retrieval-Augmented Generation), фреймворками ...
11.01.2026
  • Прямой работодатель
  • Москва
... Centicore находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и ... обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований ... ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде Обязанности ...
22.12.2025