Сортировать:
- по релевантности
- по дате
- по зарплате
... графа вычислений) разработка и интеграция техник инференс-ускорения: quantization (INT8, FP8), pruning, structured sparsity, knowledge distillation использование и доработка ML-компиляторов (TorchDyname, TorchInductor, TensorRT, и другие) для оптимизации ...
19.12.2025