Локация

Senior Data Engineer

СБЕР
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Вы можете присоединиться к команде, которая занимается генеративной аналитикой и исследованиями того, как лучше решать существующие задачи с помощью RAG.

Вы будете: заниматься поиском и внедрением передовых подходов к работе с данными с использованием ИИ. Исследовать, как применение передовых фреймворков для работы с RAG и LLM в целом влияет на результат. Создавать и поддерживать эффективные ETL-пайплайны, чтобы поставлять в систему свежие данные для работы с ними с помощью RAG. Предлагать улучшения и варианты оптимизации существующей инфраструктуры, чтобы работать еще быстрее и с б льшим количеством данных.

Обязанности

  • разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
  • разрабатывать пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования для RAG
  • проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи, связанные с RAG
  • применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых

Требования

  • умение проектировать DWH, Data Lake, Data Management Platform
  • опыт построения и развития высоконагруженных систем
  • опыт разработки и оптимизации пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
  • продвинутый уровень владения Python и SQL
  • опыт работы с движками для распределенной обработки данных (Spark, Trino)
  • опыт работы с очередями сообщений (Kafka, RabbitMQ)
  • опыт работы с MPP базами данных и понимание их внутреннего устройства (ClickHouse, Greenplum, Vertica)
  • базовые навыки DevOps (Docker, Kubernetes, Ansible, Terraform, CI/CD)
  • навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
  • инструментальное владение AI для анализа, генерации и автоматизации

Будет плюсом

  • опыт работы с облачными платформами (AWS, GCP, SberCloud)
  • опыт работы с объектными хранилищами (S3, MinIO, Ceph)
  • опыт backend-разработки
  • опыт администрирования БД
  • опыт разработки на GoLang

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
месяц назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • Островок
  • Москва
Описание Мы ищем Senior Data Engineer в команду Data Science . Обязанности: Проектирование, создание и ... данных; Взаимодействие с командой Data Science для формализации и сбора ... архитектуры данных. Требования: Опыт работы Data Engineer от 4-х лет; Опыт ...
25.12.2025
  • Прямой работодатель
  • Москва
... Компания Centicore находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся ... ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде Обязанности ... Spark-приложений Взаимодействие с командами Data Science, ML/LLM и ...
22.12.2025
  • Flocktory
  • Москва
... 70%. Мы ищем опытного Data Engineer, который усилит команду ... - разработка витрин Yandex Data processing (Apache Hadoop, Apache ... опыт работы на позиции Data Engineer, инженер хранилища данных от ... хранилищ данных: data lake, lakehouse, data vault, data mesh. И ...
13.01.2026