Code Generation On Livecodebench
评估指标
Acc
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Acc |
---|---|
planning-driven-programming-a-large-language | 59.3 |
search-o1-agentic-search-enhanced-large | 33 |
各个模型在此基准测试上的表现结果
模型名称 | Acc |
---|---|
planning-driven-programming-a-large-language | 59.3 |
search-o1-agentic-search-enhanced-large | 33 |