HyperAI超神经

Code Generation On Dseval Leetcode

评估指标

Pass Rate
w/o Intact
w/o PE

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Pass Ratew/o Intactw/o PE
mlcopilot-unleashing-the-power-of-large42.542.562.5
模型 245.045.055.0
模型 332.532.550.0
模型 445.045.060.0
模型 557.557.570.0