Локация

Стажер Data Scientist (CV)

Ecom.tech
Москва Опыт работы от 1 года Постоянная занятость Полный день
Поделиться

Описание

Сейчас мы ищем стажеров в передовые проекты по CV, включая анализ изображений (классификация, детекция, сегментация) и создание решений на основе генеративных моделей для визуального контента (генерация фона и теней, поворот объекта). Вам предстоит проводить исследования в области CV-моделей: оценивать их качество, адаптировать для работы с видео и развивать технологии модерации контента карточек, обеспечивая точность, надёжность и соответствие бизнес-требованиям.

Стек технологий:

  • Разработка: Python, Git, FastAPI, GitLab, Docker, Prometheus, Grafana.

  • ML инфраструктура: JupyterHub, MLFlow, Airflow.

  • ML: PyTorch, Diffusers, Transformers, OpenCV, Albumentations, Scikit-learn.

  • Данные: SQL (PostgreSQL/ClickHouse/GreenPlum), S3, Polars, Pandas, NumPy.

  • Процессы: Jira, Confluence.

Обязательные навыки и знания:

  • Знания и умение работать с Python, ООП.

  • Умение работать с git.

  • Понимание основ нейронных сетей для CV: принципы работы свертки, фильтров, padding, pooling.

  • Знание ключевых архитектур: ResNet, YOLO, U-Net, Transformer-based и авторегрессивные модели.

  • Практический опыт работы с готовыми моделями (Stable Diffusion и аналоги) через библиотеки (Diffusers и аналоги).

  • Знание PyTorch, и опыт с каким-либо фреймворком обучения моделей для изображений.

  • Понимание процессов предобработки изображений.

  • Понимание метрик: Accuracy, mAP, IoU, FID, Inception Score, CLIP-score.

Навыки, которые будут плюсом:

  • Знакомство с Transfer Learning и Fine-Tuning.

  • Понимание задач сегментации vs детекции, знание архитектуры U-Net для сегментации.

  • Базовое знакомство с эффективным поиском эмбеддингов (FAISS, Elasticsearch).

  • Понимание принципов работы базовых генеративных моделей: GAN, VAE, Diffusion Models.

  • Знакомство с методами контроля генерации (текстовые промпты, ControlNet).

Задачи:

Участие в полном цикле разработки решений в области компьютерного зрения:
  • Предобработка и аугментация изображений для обучения моделей.

  • Подбор, адаптация и обучение моделей для задач анализа (детекция, классификация) или генерации.

  • Оценка качества моделей с использованием релевантных метрик.

  • Помощь в интеграции моделей в пайплайны данных и создание демонстрационных прототипов.

Процесс отбора на стажировку выглядит так:

  • резюме и короткая анкета в ответ;

  • тестовое задание объемом 3 часа;

  • интервью с командой ;

  • предложение работы.

Наши стажировки оплачиваемые, длятся 3 месяца или дольше, 30-40 рабочих часов в неделю в гибком графике.

Вы будете постепенно включаться в реальные процессы разработки ML моделей: от выполнения небольших, хорошо структурированных задач, под присмотром опытного наставника до участия в обсуждении архитектуры и принятия решений. В конце стажировки сможете работать с проектами на уровне junior+ DS, понимать бизнес-задачи и вносить осознанный вклад в развитие платформы.

21 день назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
  • ИТ-компания Лоция
  • Москва
Описание Компания ИТ-компания Лоция ищет хорошего специалиста на вакансию Data Scientist (CV) . Москва (Россия). Можно удалённо. Требуемые навыки: #Python. Требования Python Обязанности Приглашаем присоединиться к масштабному и технологически сложному ...
06.01.2026
  • WILDBERRIES
  • Москва
... навыки: Глубокий опыт в области CV, наличие опыта дополнительно в NLP ... есть: Имеете опыт работы с CV сложнее классификации: детекция, сегментация и ... задачи; Имеете опыт (до)обучения CV моделей; Опыт работы в сфере ...
25.12.2025
  • Ecom.tech
  • Москва
Описание Сейчас мы ищем стажеров в команду разработки и улучшения классических ML-моделей для прогнозирования заказов, нагрузки и оттока курьеров, персонализированных коммуникаций и скидок, а также оптимизации логистики. Стек технологий: Разработка: ...
12.01.2026