4 个月前

用于探索的噪声网络

Meire Fortunato; Mohammad Gheshlaghi Azar; Bilal Piot; Jacob Menick; Ian Osband; Alex Graves; Vlad Mnih; Remi Munos; Demis Hassabis; Olivier Pietquin; Charles Blundell; Shane Legg

摘要

我们介绍了NoisyNet，这是一种在权重中加入参数噪声的深度强化学习代理，并展示了该代理策略所引起的随机性可以用于促进有效的探索。噪声的参数通过梯度下降与网络中的其他权重一同学习。NoisyNet的实现简单直接，且计算开销很小。我们发现，用NoisyNet替代A3C、DQN和双网络代理（分别对应熵奖励和$\varepsilon$-贪婪）的传统探索启发式方法，可以在广泛的Atari游戏中显著提高得分，在某些情况下甚至使代理从次人类水平提升到超人类水平的表现。

代码仓库

seungjaeryanlee/rldb

GitHub 中提及

Kaixhin/NoisyNet-A3C

pytorch

GitHub 中提及

LilTwo/DRL-using-PyTorch

pytorch

GitHub 中提及

chainer/chainerrl

pytorch

GitHub 中提及

YanSong97/Master-thesis

pytorch

GitHub 中提及

BY571/DQN-Atari-Agents

pytorch

GitHub 中提及

behzadanksu/rl-attack

GitHub 中提及

mindspore-courses/Rainbow-MindSpore

mindspore

GitHub 中提及

Curt-Park/rainbow-is-all-you-need

GitHub 中提及

thomashirtz/noisy-networks

pytorch

GitHub 中提及

opendilab/DI-engine

pytorch

hw9603/DQfD-PyTorch

pytorch

GitHub 中提及

chandar-lab/RLHive

pytorch

behzadanksu/rlattack-dev

GitHub 中提及

MOVzeroOne/DQN

pytorch

GitHub 中提及

基准测试

基准	方法	指标
atari-games-on-atari-2600-alien	NoisyNet-Dueling	Score: 5778
atari-games-on-atari-2600-amidar	NoisyNet-Dueling	Score: 3537
atari-games-on-atari-2600-assault	NoisyNet-Dueling	Score: 11231
atari-games-on-atari-2600-asterix	NoisyNet-Dueling	Score: 28350
atari-games-on-atari-2600-asteroids	NoisyNet-Dueling	Score: 86700
atari-games-on-atari-2600-atlantis	NoisyNet-Dueling	Score: 972175
atari-games-on-atari-2600-bank-heist	NoisyNet-Dueling	Score: 1318
atari-games-on-atari-2600-battle-zone	NoisyNet-Dueling	Score: 52262
atari-games-on-atari-2600-beam-rider	NoisyNet-Dueling	Score: 23134
atari-games-on-atari-2600-berzerk	NoisyNet-Dueling	Score: 1896
atari-games-on-atari-2600-boxing	NoisyNet-Dueling	Score: 100
atari-games-on-atari-2600-breakout	NoisyNet-Dueling	Score: 263
atari-games-on-atari-2600-centipede	NoisyNet-Dueling	Score: 7596
atari-games-on-atari-2600-chopper-command	NoisyNet-Dueling	Score: 11477
atari-games-on-atari-2600-crazy-climber	NoisyNet-Dueling	Score: 171171
atari-games-on-atari-2600-defender	NoisyNet-Dueling	Score: 42253
atari-games-on-atari-2600-demon-attack	NoisyNet-Dueling	Score: 69311
atari-games-on-atari-2600-double-dunk	NoisyNet-Dueling	Score: 1
atari-games-on-atari-2600-enduro	NoisyNet-Dueling	Score: 2013
atari-games-on-atari-2600-fishing-derby	NoisyNet-Dueling	Score: 57
atari-games-on-atari-2600-freeway	NoisyNet-Dueling	Score: 34
atari-games-on-atari-2600-frostbite	NoisyNet-Dueling	Score: 2923
atari-games-on-atari-2600-gopher	NoisyNet-Dueling	Score: 38909
atari-games-on-atari-2600-gravitar	NoisyNet-Dueling	Score: 2209
atari-games-on-atari-2600-hero	NoisyNet-Dueling	Score: 31533
atari-games-on-atari-2600-ice-hockey	NoisyNet-Dueling	Score: 3
atari-games-on-atari-2600-kangaroo	NoisyNet-Dueling	Score: 15227
atari-games-on-atari-2600-krull	NoisyNet-Dueling	Score: 10754
atari-games-on-atari-2600-kung-fu-master	NoisyNet-Dueling	Score: 41672
atari-games-on-atari-2600-montezumas-revenge	NoisyNet-Dueling	Score: 57
atari-games-on-atari-2600-ms-pacman	NoisyNet-Dueling	Score: 5546
atari-games-on-atari-2600-name-this-game	NoisyNet-Dueling	Score: 12211
atari-games-on-atari-2600-phoenix	NoisyNet-Dueling	Score: 10379
atari-games-on-atari-2600-pitfall	NoisyNet-Dueling	Score: 0
atari-games-on-atari-2600-pong	NoisyNet-Dueling	Score: 21
atari-games-on-atari-2600-private-eye	NoisyNet-Dueling	Score: 279
atari-games-on-atari-2600-qbert	NoisyNet-Dueling	Score: 27121
atari-games-on-atari-2600-road-runner	NoisyNet-Dueling	Score: 234352
atari-games-on-atari-2600-robotank	NoisyNet-Dueling	Score: 64
atari-games-on-atari-2600-seaquest	NoisyNet-Dueling	Score: 16754
atari-games-on-atari-2600-skiing	NoisyNet-Dueling	Score: -7550
atari-games-on-atari-2600-solaris	NoisyNet-Dueling	Score: 6522
atari-games-on-atari-2600-space-invaders	NoisyNet-Dueling	Score: 5909
atari-games-on-atari-2600-star-gunner	NoisyNet-Dueling	Score: 75867
atari-games-on-atari-2600-surround	NoisyNet-Dueling	Score: 10
atari-games-on-atari-2600-tennis	NoisyNet-Dueling	Score: 0
atari-games-on-atari-2600-time-pilot	NoisyNet-Dueling	Score: 17301
atari-games-on-atari-2600-tutankham	NoisyNet-Dueling	Score: 269
atari-games-on-atari-2600-up-and-down	NoisyNet-Dueling	Score: 61326
atari-games-on-atari-2600-venture	NoisyNet-Dueling	Score: 815
atari-games-on-atari-2600-video-pinball	NoisyNet-Dueling	Score: 870954
atari-games-on-atari-2600-wizard-of-wor	NoisyNet-Dueling	Score: 9149
atari-games-on-atari-2600-yars-revenge	NoisyNet-Dueling	Score: 86101
atari-games-on-atari-2600-zaxxon	NoisyNet-Dueling	Score: 14874

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

用于探索的噪声网络

摘要

代码仓库

基准测试

用 AI 构建 AI

Hyper Newsletters