В традиционном подходе к эволюции роботов требуется много времени и ресурсов, чтобы выявить успешные комбинации параметров поведения. Новый метод позволяет значительно ускорить этот процесс, он основан на использовании алгоритмов машинного обучения для оптимизации поведения робота в процессе проб и ошибок.
из новости совсем непонятно, в чем конкретная разница между уже известными подходами обучения с подкреплением и новым предложенным. хоть бы ссылку на исследование дали