HyperAI超神经

Auto Debugging On Big Bench Lite

评估指标

Exact string match

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Exact string match
palm-scaling-language-modeling-with-pathways-138.2
palm-scaling-language-modeling-with-pathways-114.7
palm-scaling-language-modeling-with-pathways-138.2