Сортировать:
- по релевантности
- по дате
- по зарплате
... : MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования. Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы. Опыт реализации RL-систем: построение агента, буфера опыта ...
30.12.2025
... онлайн востребованные профессии тем, кто решился. Мы ставим амбициозную цель и запускаем образовательный курс по обучению Machine Learning. Для этого мы ищем авторов, которые совместно с методистом, редакторами, иллюстраторами создадут контент для нового ...
25.12.2025