Искусственный интеллект научили побеждать в играх без знания правил

Лoндoнскaя кoмпaния DeepMind, дoчeрнee прeдприятиe Alphabet, сoздaлa систeму oбучeния MuZero, кoтoрaя пoбeждaeт в шaxмaтax и ​​другиx игрax аж без знания правил.

Об этом сообщает Укринформ со ссылкой возьми Spectrum.

Издание отмечает, подобно как система тренируется действие за действием и "наблюдает" ради наградами, которые она получает по прошествии времени этого. Например, в шахматах — это допоставить мат, а в Pac Man — проглотить желтую точку. По прошествии времени она меняет методы игры, для того чтоб как можно эффективнее получить тантьема, то есть улучшает свои знания.

Этот вид обучения путем наблюдения годится для любого искусственного интеллекта, что сталкивается со сложными проблемами. Исключая абстрактных игр в реальном мире их равно как достаточно.

Томас Хуберт, один с соавторов статьи в Nature, сообщил, почему исследователи развивают систему обучения, с тем она могла сжать размер видео. Средь других планов применения — самоуправляемые механизмы и дизайн белков, что станет следующим шажком после технологии сборки белков (которую давеча освоила дочерняя программа AlphaFold). Целью может -побывать) разработка фармацевтического препарата на основе летяга, который должен действовать на вирус иль рецептор на поверхности клетки.

Система DeepMind получила славу благодаря AlphaGo — системе обучения, победившей в игре Го по прошествии времени тренировок в миллионах игр уровня мастера. В 2018 году набор выпустила AlphaZero, которая научилась разить в игре в шахматы и Го без тренировки получай мастер-играх и советов. Преимущество MuZero середь других систем в том, что ей ажно не нужно показывать правила, (для того она победила в игре.

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.