HyperAI超神经

Question Answering On Casehold

评估指标

Macro F1 (10-fold)

评测结果

各个模型在此基准测试上的表现结果