Openai Gym On Pendulum V1

Action Repetition

Average Decisions

Mean Reward

评测结果

各个模型在此基准测试上的表现结果

				Paper Title	Repository
TLA with Hierarchical Reward Functions	.8073	38.6	-125.02	Creating Hierarchical Dispositions of Needs in an Agent
TLA	.7032	62.31	-154.92	Optimizing Attention and Cognitive Control Costs Using Temporally-Layered Architectures

0 of 2 row(s) selected.