![]() |
|
#1
|
||||
|
||||
![]() Цитата:
Во первых не понимаю где ты видел в нейросети дафний или младенца такой вид обучения. А во вторых энтот их диплернинг и "графы" даже нейросетью с трудом язык поворачивается назвать, скорее уравнения с множеством переменных, где переменные выбираются через другие уравнения. |
#2
|
|||
|
|||
![]() Цитата:
обучение с учителем link обучение с подкреплением link Дафния должна сначала двигаться хаотически, случайно есть крошки. Поедания крошки это подкрепление. Она должна запоминать поведение, приведшее к подкреплению и повторять его постепенно совершенствуя. На словах легко, а как сделать? Затем можно сделать, допустим красные крошки, чтобы были невкусные, то есть отрицательное подкрепление. И Дафния должна будет их огибать. |
#3
|
||||
|
||||
![]() "поэтому такое обучение является частным случаем обучения с учителем"
В статье про обучение с подкреплением. Я смотрел как обучение "с подкреплением" реализуют, когда обучают ИИ играть в компьютерные игры. Фактически это чистое обучение с учителем + эволюционные алгоритмы (тысячи повторений). Я просто не хочу в сортах говна разбираться, так сказать, как по мне это всё "обучение с учителем" в разных формах(что и написано в приведенной цитате из википедии). Нужно делать обучение без учителя в принципе. Так что-бы в качестве поведенческой цели в ходе всего процесса было само по себе эффективное обучение. Строим модель окружающего мира, и ведем себя так, что-бы максимально быстро эту модель проверять, улучать, отшлифовывать. ![]() А когда модель будет готова, можно уже и заранее поставленных "целей подкрепления" достигать. |
#4
|
|||
|
|||
![]() Цитата:
![]() Но практика критерий истины, пробуй. Нервная система полностью на клиенте, ему и все карты в руки. Моя планируемая нервная система наверное будет подходить под категорию "обучение с подкреплением". |
#5
|
|||
|
|||
![]() В апреле продолжил:
Этап 2. Сверхбыстрая физика. 1. Теперь сервер поддерживает множество клиентов. Две дафнии впервые увидели друг друга. 2. На сервере реализован TCP/IP протокол для администратора. Он нужен для красивых демонстраций происходящего на сервере на графике Unreal Engine. Сейчас UE4 клиент уже умеет закачивать с сервера состояние вселенной (положение шариков корма), но пока он видит только собственную дафнию, что делают другие дафнии не видно. 3. Разработан минимальный клиент на WinApi, который коннектится к серверу, отображает состояние глаза Дафнии, а также даёт команды моторным нейронам с клавиатуры. 4. Создан ютуб-канал и записан демонстрационный ролик. https://youtu.be/VyoSWdGh6Rg Сервер https://github.com/talashby/DaphniaServer Клиент UE4 https://github.com/talashby/Daphnia Клиент WinApi https://github.com/talashby/DaphniaWinApi В планах сделать минимальные клиенты на Unity и на Python, для лёгкого старта желающих участвовать в проекте. Далее сам буду разрабатывать нервную систему на WinApi-клиенте. Преимущества научно-исследовательского проекта Дафния перед другими ИИ-проектами: - упрощённая физика с чёткими законами - распараллеливаемость физики На мой взгляд реальная физика слишком сложна для компьютерного моделирования, как в плане быстродействия, её трудно распараллелить по ядрам, так и в плане качественной реализации. Обычно приходится обходить множество нюансов, что является препятствием для усложнения мира, где существует ИИ. |