![]() |
#14
|
||||
|
||||
![]() "поэтому такое обучение является частным случаем обучения с учителем"
В статье про обучение с подкреплением. Я смотрел как обучение "с подкреплением" реализуют, когда обучают ИИ играть в компьютерные игры. Фактически это чистое обучение с учителем + эволюционные алгоритмы (тысячи повторений). Я просто не хочу в сортах говна разбираться, так сказать, как по мне это всё "обучение с учителем" в разных формах(что и написано в приведенной цитате из википедии). Нужно делать обучение без учителя в принципе. Так что-бы в качестве поведенческой цели в ходе всего процесса было само по себе эффективное обучение. Строим модель окружающего мира, и ведем себя так, что-бы максимально быстро эту модель проверять, улучать, отшлифовывать. ![]() А когда модель будет готова, можно уже и заранее поставленных "целей подкрепления" достигать. |