Сортировать:
- по релевантности
- по дате
- по зарплате
... лидировать направление по разработке и оптимизации CUDA/Triton-ядер для LLM тесно взаимодействовать с ML-инженерами и research-командами для понимания workload ов и bottleneck ов (например: multinode inference, sparse attention, mixture-of-experts, long ...
25.12.2025