Локация

Работа "data engineer (big data) scala" в Москве (24 вакансии)

Сортировать:
  • СБЕР
  • Москва
... оптимизация производительности запросов знание одного или нескольких языков программирования: PL/SQL, T-SQL, Java, Python, Scala на уровне переменных, процедур, функций, циклов, условных операторов знание одного или нескольких ETL-инструментов: Informatica ...
13.01.2026
  • СБЕР
  • Москва
... Люди и Культура . Создаваемые нами Data-продукты являются основой для комплексной ... реальных данных. Мы ищем сильного data инженера на проект по созданию ... Data продуктов внутри аналитического хранилища. Обязанности ...
13.01.2026
  • СБЕР
  • Москва
... , диагностика и устранение неполадок, исправление старых багов и создание новых Требования умение проектировать DWH, Data Lake, Data Management Platform опыт построения и развития высоконагруженных систем опыт разработки и оптимизации пайплайнов (batch ...
25.12.2025
  • СБЕР
  • Москва
... , диагностика и устранение неполадок, исправление старых багов и создание новых. Требования умение проектировать DWH, Data Lake, Data Management Platform опыт построения и развития высоконагруженных систем опыт разработки и оптимизации пайплайнов (batch ...
25.12.2025
  • СБЕР
  • Москва
... систем оркестрации опыт работы с S3 или совместимыми объектными хранилищами, понимание структуры и принципов организации data-lake понимание принципов распределённой обработки данных и работы PySpark уверенные навыки разработки на Python, включая ...
13.01.2026
  • СБЕР
  • Москва
Описание Вы будете работать над одним из ключевых проектов Сбербанка разработкой современного ситуационного центра кибербезопасности (SOC). Ежедневно SOC обрабатывает более 500 миллиардов событий кибербезопасности, что требует уникальных инженерных ...
13.01.2026
  • СБЕР
  • Москва
... эффективность деятельности, управление численностью Группы, Data-driven инсайты для стратегии, анализ ... ML моделей совместно с ML Engineer/Data Engineer; end2end-разработка ML-моделей, ... моделей по CRISP-DM от Data Understanding до Deployment с использованием ...
25.12.2025
  • СБЕР
  • Москва
... навыков. Используемые технологии: Backend: Python, Spring Framework (IoC/DI, beans), Hibernate, REST Data: Postgres, Hadoop, ElasticSearch, Ignite ETL: Spark, Scala, Python, AirFlow, Zeppelin, Kafka CI/CD: Docker, OpenShift/K8s, Jenkins, Ansible, Nexus ...
13.01.2026
  • СБЕР
  • Москва
Описание Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat ... релевантный опыт в роли NLP Engineer от двух лет навыки работы ...
25.12.2025
  • СБЕР
  • Москва
Описание Наша команда занимается созданием аналитической платформы профиля клиента, основанной на технологиях big data и искусственного интеллекта. Платформа позволяет бизнесу получить актуальную информацию о финансовом поведении клиента, его профиле, ...
25.12.2025
  • СБЕР
  • Москва
Описание Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это фундамент, с которого начинается путь современной LLM модели и то, от чего наиболее зависит ее итоговое качество. Сырых данных ...
13.01.2026
  • СБЕР
  • Москва
Описание Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их ...
12.01.2026
  • СБЕР
  • Москва
Описание Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, использование навыков, безопасность модели и пр. Кроме подготовки базовой модели, мы реализуем продуктовые ...
25.12.2025
  • СБЕР
  • Москва
... , лингвисты, разработчики и специалисты по Data Science) создаёт инновационные продукты на ... неочевидные решения Имеешь опыт в Data Science/NLP или разработке ИИ ...
25.12.2025
  • СБЕР
  • Москва
... моделей: тренировка и дообучение мультимодальных моделей на русском языке (OCR, Embeddings, Rerankers, VLM) MLOps и Data Management: Организация и автоматизация процесса разметки данных (от сбора до контроля качества краудсорсинга) развитие автономных ...
13.01.2026
  • СБЕР
  • Москва
... младших исследователей и инженеров, участие в планировании исследовательской дорожной карты взаимодействие с командами Pretraining, Data, Infrastructure, Production для масштаб пайплайнов и повышения стабильности моделей в продакшене поддержание и ...
13.01.2026
  • СБЕР
  • Москва
... систем (Hadoop, YTsaurus) опыт настройки сервис-мешей (Istio) понимание принципов безопасности в DevOps (DevSecOps) опыт сопровождения data-платформ и сервисов на основе ClickHouse/Kafka Условия комфортный современный офис рядом с м. Кутузовская гибридный ...
13.01.2026
  • СБЕР
  • Москва
... СОП: evidence-by-step , отчёты аудита, привязка к версии инструкции Требования 4 6+ лет в Applied ML/NLP и/или Data/ML Platform, продовые запуск и поддержка. Сильный Python (типичный стек: FastAPI, asyncio, pydantic), уверенный SQL. Практика с LLM/NLP ...
13.01.2026
  • СБЕР
  • Москва
... систем (Hadoop, YTsaurus) опыт настройки сервис-мешей (Istio) понимание принципов безопасности в DevOps (DevSecOps) опыт сопровождения data-платформ и сервисов на основе ClickHouse/Kafka. Условия комфортный современный офис рядом с м. Кутузовская гибридный ...
12.01.2026
  • СБЕР
  • Москва
... моделей: тренировка и дообучение мультимодальных моделей на русском языке (OCR, Embeddings, Rerankers, VLM) MLOps и Data Management: Организация и автоматизация процесса разметки данных (от сбора до контроля качества краудсорсинга) развитие автономных ...
13.01.2026
  • СБЕР
  • Москва
... из них заметная часть в Python + PyTorch / TensorFlow. продакшен-опыт c ASR или KWS (keyword spotting). глубокое понимание Data Engineering: versioning большого аудио-корпуса. умение читать и прототипировать статьи, превращая их в рабочий код. Плюсом будет ...
25.12.2025
  • СБЕР
  • Москва
... , которая позволяет нашим Data Scientist ам и ML Engineer ам экспериментировать, обучать ... систем хранения взаимодействовать с командами Data Science, Machine Learning и бизнес ...
12.01.2026
  • СБЕР
  • Москва
... управления Опыт промышленной реализации AI проектов Уверенное владение стандартными инструментами стека ML/DS (Python) и Big Data (Spark, PySpark) Опыт использования GenAI продуктов для личной эффективности и/или разработки продуктов Знание Python ...
25.12.2025
  • СБЕР
  • Москва
... моделей в проде. Инфраструктура и данные: 500+ GPU A100 (80GB) выделенный вычислительный кластер. Spark / Hadoop для распределённой обработки Big Data. Доступ к полным финансовым и клиентским данным для обучения. Требования опыт от 2 4 лет в ML-инжиниринге ...
19.12.2025