Сортировать:
- по релевантности
- по дате
- по зарплате
... : FlashAttention, PagedAttention, DeepEP, и др. Среди наших достижений - реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше Цель - снизить latency и увеличить throughput ...
11.01.2026