Сортировать:
- по релевантности
- по дате
- по зарплате
... LLM в бизнес-процессы и пр. Обязанности сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.) улучшение пайплайнов предобработки данных для разметки и обучения работа в плотной ...
29.12.2025