ML-engineer (GigaChat Data)
СБЕРОписание
Мы - команда ML-инженеров GigaChat Data.
Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:
- Core модели базовые модели
- продукты B2C WEB-версия GigaChat, персонализированные интеллектуальные ассистенты
- внутренние банковские задачи автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников
- внешние заказчики кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы.
Задачи:
- сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO)
- улучшение пайплайнов предобработки данных для разметки и обучения
- работа в плотной связке с командой ML, LoRA-finetuning
- взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций)
- расчет метрик и принятие решений по улучшению качества данных на их основе.
Для нас важно:
- знания Python на очень высоком уровне
- опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и др.)
- понимание процессов работы с данными для больших языковых моделей
- способность решать проблемы и организовывать работу в условиях многозадачности.
Будет плюсом:
- опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).
Мы предлагаем:
- крупнейшее DS&AI community более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность выбрать удобный формат работы: гибрид или офис
- комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
13 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Описание Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех ... модели. Направления задач: звуковая модальность GigaChat - большой языковой модели для генерации ...
25.12.2025
... ищет хорошего специалиста на вакансию ML-инженер (GigaChat Data) . Москва (Россия). Полный рабочий ... , NLP Обязанности Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для ...
05.01.2026
Описание Magnit Omni ищет ML Engineer / Senior Data Scientist Мы развиваем персонализацию для ... , бустингом и современными ML-фреймворками. Хочет развивать ML в ритейле, работать с ...
12.01.2026