Tech Project Manager (GigaChat Analytics)
СБЕРОписание
Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, использование навыков, безопасность модели и пр. Кроме подготовки базовой модели, мы реализуем продуктовые решения на основе базовой модели.
Одно из важнейших направлений нашей команды - обучение LLM GigaChat точным наукам, юриспруденции, медицине. Сотни профессиональных исследователей готовят обучающие данные (чистят, структурируют и пишут с нуля ), ML-специалисты обучают модели. Мы работаем с лучшими университетами страны. Чтобы процессы были максимально эффективными, на всех этапах подготовки модели нам требуется четкая координация.
Что предстоит делать
Требования (обязательные)
Базовые знания Python, уверенная работа с Pandas и опыт работы с Jupyter для анализа и визуализации данных
Опыт выстраивания процессов управления данными и координации работы различных команд
Хорошие коммуникативные навыки, способность эффективно взаимодействовать с разными отделами
Понимание процессов работы с большими объемами данных и опыт работы с инструментами анализа данных
Способность решать проблемы и организовывать работу в условиях многозадачности.
Понимание принципов работы LLM, этапов обучения моделей и базовых статистических метрик, используемых в ML.
Будет плюсом
Знание SQL, опыт работы с базами данных
Работа с платформами по разметке данных (TagMe, Toloka, Яндекс.Задания и т.п.)
Обязанности
- организовывать и управлять процессами по разметке данных внутри команды GigaChat Data, совершенствовать существующие пайплайны
- налаживать эффективные коммуникации между различными командами (data аналитики, менеджеры разметки и другие)
- создавать инструменты по онбордингу и обучению разметчиков и AI-тренеров
- контролировать качество данных и их доступность для всех участников процесса
- строить и автоматизировать отчетность на основе данных (аналитика для доработки мониторингов и других инструментов контроля разметки данных, дашборды с метриками качества разметки, статистики по разметчикам/проектам и др).
Требования
- базовые знания Python, уверенная работа с Pandas и опыт работы с Jupyter для анализа и визуализации данных
- опыт выстраивания процессов управления данными и координации работы различных команд
- хорошие коммуникативные навыки, способность эффективно взаимодействовать с разными отделами
- понимание процессов работы с большими объемами данных и опыт работы с инструментами анализа данных
- способность решать проблемы и организовывать работу в условиях многозадачности.
- понимание принципов работы LLM, этапов обучения моделей и базовых статистических метрик, используемых в ML.
Условия
- крупнейшее DS&AI community более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность выбрать удобный формат работы: гибрид или офис
- комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.