Специалист по сбору и разметке данных
НейроэкспертОписание
Мы разрабатываем ИИ-продукты для автоматизации бизнес-процессов: боты-ассистенты, парсеры документов, системы аналитики.
Сейчас у нас есть несколько проектов по подбору автозапчастей, мы не подбираем их сами, на это есть специализированные сервисы, откуда можно взять данные для разметки датасетов.
Также у нас есть проект по анализу совещаний, подготовке протоколов, в него входят аудиозаписи совещаний, протоколы, отчеты об эффективности совещаний.
Сейчас ищем человека, который поможет собирать и размечать данные для обучения и тестирования наших моделей. Это не конвейерная работа нужен живой, исследовательский подход.
Чем эта вакансия отличается от типичных
Типичная разметка: конвейер, кликаешь в спец-инструменте
У нас: живой поиск, ходишь по сайтам, читаешь документы
Типичная разметка: однотипные задачи
У нас: разнообразие, сегодня КП, завтра совещания, послезавтра автозапчасти
Типичная разметка: изоляция от продукта
У нас: видишь, как данные влияют на качество ИИ
Мы ценим вопросы. Если что-то непонятно спроси. Если нашёл странность сообщи.
Обязанности:
-
Сбор данных
- Анализ бизнес-документов: коммерческие предложения (КП), договоры, стенограммы совещаний
- Исследование источников: сайты поставщиков, открытые базы
- Креатив: придумывать, где ещё можно найти нужные примеры
Разметка данных
- Заполнение эталонных ответов в Excel
- Работа по готовым инструкциям: "вот документ/сайт извлеки эти поля заполни таблицу"
- Проверка и корректировка черновиков, которые сгенерировал ИИ
Ручное тестирование
- По готовым тест-планам
- Фиксация расхождений
- Поиск аномалий, которые не покрыты автотестами
Документирование
- Фиксация пробелов: "для этого класса примеров данных нет"
- Предложения по улучшению процесса
-
Софт-скиллы
- Пытливость и любознательность - готовность искать данные в нестандартных местах
- Усидчивость - способность качественно обрабатывать много примеров
- Внимание к деталям - замечать опечатки, несоответствия, аномалии
- Умение задавать вопросы - не молчать, если что-то непонятно или кажется странным
Будет плюсом
- Опыт в закупках, снабжении, документообороте - понимание структуры бизнес-документов
- Опыт работы с автозапчастями, из них тоже собираем датасеты.
- Опыт ручного тестирования (QA) - понимание, что такое тест-кейсы и баг-репорты
- Опыт работы с данными
-
- Удалённая работа
- Гибкий график - главное результат, не часы
- Сдельная оплата - платим за объём выполненной работы
- Созвоны 1-2 раза в неделю - синхронизация, ответы на вопросы, обратная связь
- Объём работы - гибко, зависит от текущих проектов