Обучение с подкреплением
Парадигма машинного обучения, в которой агенты совершенствуются, оптимизируя вознаграждения в процессе взаимодействия со средой.
Articles about Обучение с подкреплением
DeepMind Powers Boston Dynamics' Atlas