Локация

Работа "deep learning lead" в Москве (1 вакансия)

Сортировать:
  • Яндекс
  • Москва
... RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования. Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы. Опыт реализации RL-систем: построение агента, буфера ...
25.12.2025