Главная
Работа в Москве
AI/LLM Engineer (Кипр)

AI/LLM Engineer (Кипр)

Selecty

Москва Опыт работы от 3 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

Наш клиент - ведущий дистрибьютор продуктов и решений в области информационных и коммуникационных технологий.

Локация: Кипр (обязательная релокация)

Формат работы:

Офис или гибридный формат - три удалённых рабочих дня и два дня в офисе (вторник и четверг). Офис в Лимассоле

О позиции:

Компания создает новую платформу автоматизации для внутреннего использования, которая объединяет бизнес-процессы, AI-модели и внутренние системы. Нам необходимо разработать внутреннюю AI-платформу на базе самостоятельно размещённых (self-hosted) LLM-моделей .

Мы ищем AI/LLM инженера, который будет разворачивать модели локально или в гибридной среде, строить API-слой для взаимодействия с ними и интегрировать их с нашими автоматизированными workflow (n8n) и внутренними инструментами.

Вы будете работать над производительностью моделей, пайплайнами извлечения данных (RAG) и обеспечением безопасной обработки внутренних корпоративных данных.

Обязанности:

Развёртывание и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.).
Разработка API-эндпоинтов (FastAPI/REST) для взаимодействия с моделями.
Создание и поддержка RAG-пайплайнов: эмбеддинги, чанкинг, векторный поиск.
Работа с векторными базами данных (Chroma, Milvus, Faiss, Qdrant).
Интеграция AI-сервисов с автоматизацией в n8n.
Настройка промптов и поведения моделей для повышения качества ответов.
Мониторинг производительности моделей, задержек и использования ресурсов.
Обеспечение безопасной и конфиденциальной обработки внутренних данных.

Требования:

Llama / Qwen / Mistral, Python, FastAPI, векторные БД.
Опыт работы в ML/AI-инжиниринге от 3 лет.
Практический опыт развёртывания и инференса LLM-моделей.
Уверенные знания Python и опыт работы с FastAPI или аналогичными фреймворками.
Опыт работы с векторным поиском или RAG-пайплайнами.
Понимание принципов проектирования API и оптимизации производительности систем.

Будет плюсом:

Опыт работы с GPU-серверами NVIDIA.
Базовые знания LoRA / QLoRA-файнтюнинга.
Опыт интеграции AI-систем с платформами автоматизации.
Знание принципов защиты данных и безопасных ML-процессов.

Условия работы:

Фиксированный график работы.
Командировки.
Возможность работать в финансово устойчивой и быстрорастущей международной компании.
Постоянное взаимодействие с глобальными командами профессионалов.
Международные карьерные возможности.
Доступ к непрерывному профессиональному развитию: обучение, сертификационные программы, мероприятия и тимбилдинги.
Медицинская страховка.
Конкурентный компенсационный пакет и система мотивации.

ChatGPT может допускать ошибки. Проверяйте важную информацию. Смотрите настройки cookie-файлов.

Откликнуться

месяц назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Senior Python Developer / Backend Architect (AI/LLM, FastAPI)

от 300 000 руб.

Леусова Екатерина Сергеевна
Москва

... корпоративные системы) Ищем Senior Python Engineer / Backend Architect, который умеет ... REST API / Встраивать паттерны. AI/LLM-часть: Интегрировать LLM (OpenAI, Ollama) в бизнес ... в сторону Architect / Tech Lead / AI-engineer; Работа над продуктом с реальными ...

12.01.2026

от 300 000 руб.

Tech Lead / AI Solutions Engineer (Generative AI / LLM)

Интерпроком,ООО
Москва

... технологическое лидерство в области AI/LLM/ML и выстроить короткий ... , Weaviate, Qdrant), streaming inference, LLM observability Архитектура и Backend: проектирование ... MLOps-практик и инструментов LLM-observability. Понимание рисков LLM (hallucinations, bias, ...

25.12.2025

Senior AI/ML Engineer (команда RnD)

SberTech
Москва

... ищем в свои ряды Senior AI/ML Engineer. Вы будете участвовать в ... : LangChain, LangGraph Опыт работы с LLM (OpenAI, GigaChat, LLaMA, Qwen и ... в своей профессиональной области Владение AI-инструментами для анализа, генерации и ...

12.01.2026

Посмотреть все похожие вакансии