Question Answering On Cronquestions
评估指标
Hits@1
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Hits@1 |
---|---|
time-aware-multiway-adaptive-fusion-network | 78.4 |
模型 2 | 15.1 |
模型 3 | 28.8 |
tempoqr-temporal-question-reasoning-over | 24.3 |
模型 5 | 28.8 |
模型 6 | 75.4 |
tempoqr-temporal-question-reasoning-over | 74.5 |
模型 8 | 81.1 |
模型 9 | 7.1 |
question-calibration-and-multi-hop-modeling | 97.1 |
模型 11 | 22.6 |
self-improvement-programming-for-temporal | 93.7 |
improving-time-sensitivity-for-question | 83.1 |
模型 14 | 92 |
two-stage-generative-question-answering-on | 97.8 |
模型 16 | 96.9 |
模型 17 | 7 |
模型 18 | 80.6 |
tempoqr-temporal-question-reasoning-over | 91.8 |
模型 20 | 92 |
模型 21 | 96.9 |
temporal-knowledge-graph-question-answering | 96.6 |
模型 23 | 22.5 |
question-answering-over-temporal-knowledge | 64.7 |
tempoqr-temporal-question-reasoning-over | 79.9 |
模型 26 | 27.8 |
模型 27 | 28.8 |
模型 28 | 90.9 |
模型 29 | 25.2 |