Локация

ML-engineer (GigaChat Data)

СБЕР
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы - команда ML-инженеров GigaChat Data.

Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:

  • Core модели базовые модели
  • продукты B2C WEB-версия GigaChat, персонализированные интеллектуальные ассистенты
  • внутренние банковские задачи автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников
  • внешние заказчики кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы.

Задачи:

  • сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO)
  • улучшение пайплайнов предобработки данных для разметки и обучения
  • работа в плотной связке с командой ML, LoRA-finetuning
  • взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций)
  • расчет метрик и принятие решений по улучшению качества данных на их основе.

Для нас важно:

  • знания Python на очень высоком уровне
  • опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и др.)
  • понимание процессов работы с данными для больших языковых моделей
  • способность решать проблемы и организовывать работу в условиях многозадачности.

Будет плюсом:

  • опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).

Мы предлагаем:

  • крупнейшее DS&AI community более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
13 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • СБЕР
  • Москва
Описание Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех ... модели. Направления задач: звуковая модальность GigaChat - большой языковой модели для генерации ...
25.12.2025
  • Сбер
  • Москва
... ищет хорошего специалиста на вакансию ML-инженер (GigaChat Data) . Москва (Россия). Полный рабочий ... , NLP Обязанности Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для ...
05.01.2026
  • МАГНИТ, Розничная сеть
  • Москва
Описание Magnit Omni ищет ML Engineer / Senior Data Scientist Мы развиваем персонализацию для ... , бустингом и современными ML-фреймворками. Хочет развивать ML в ритейле, работать с ...
12.01.2026