Сортировать:
- по релевантности
- по дате
- по зарплате
... разработка и оптимизация кастомных CUDA-операторов и расширений для PyTorch ... Ampere, Hopper и новее). интеграция CUDA-оптимизаций в распределённые пайплайны обучения ... Требования экспертный уровень C++ и CUDA. опыт оптимизации производительности для NVIDIA ...
26.12.2025
Описание Мы ищем Senior MLOps Engineer, который примет активное участие в ... в prod. Требования: Опыт работы в качестве DevOps/MLOps/ML Engineer не ...
25.12.2025
... оптимизации. Оптимизация операций на уровне CUDA/triton ядер, улучшение производительности ... языка. Ищем NLP Engineer, с которым будем делать GigaChat умнее. Для ... распределённым обучением (DDP/FSDP/параллелизмы), CUDA/NCCL/профилирование, MoE/FP8, ...
29.12.2025
... работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов инструментальное владение AI для анализа ...
25.12.2025
Описание Мы команда GigaChat - создаём и развиваем ... в FP8; развитие метрик качества GigaChat-a, например, через оценку ... NLP Engineer, с которым мы будем вместе совершенствовать и развивать GigaChat. ... LLM's; C++ & CUDA; будет плюсом наличие публикаций Условия ...
25.12.2025
... свои идеи. Мы ищем в свои ряды Senior AI/ML Engineer. Вы будете участвовать в исследованиях, проверке ... для построения агентов: LangChain, LangGraph Опыт работы с LLM (OpenAI, GigaChat, LLaMA, Qwen и др.) Опыт построения RAG (классический RAG, GraphRAG ...
26.12.2025
... на C++ до выкатки в Prod и дальнейшего улучшения качества Обязанности ... оптимизацией под NPU / DSP / GPU / Cuda / CPU Опыт разработки под Android ...
25.12.2025
... ML моделей совместно с ML Engineer/Data Engineer; end2end-разработка ML-моделей ... / SFT) большой языковой модели Сбера (GigaChat) с использованием внутренних / синтетических данных ...
25.12.2025
... (TorchDyname, TorchInductor, TensorRT, и другие) для оптимизации вычислительных графов совместная работа с командами CUDA operators и Distributed Learning для обеспечения максимальной производительности на GPU проектирование и проведение экспериментов по ...
19.12.2025
... оценка релевантности) исследование и настройка multi-agent orchestration (LangGraph, LangChain, schema guided reasoning pipelines) работа с GigaChat как основной моделью, а также эксперименты с ChatGPT, Gemini, Qwen fine-tuning моделей (instruction-tuning ...
26.12.2025