Semantic Textual Similarity
基准测试列表
该任务相关的所有基准测试列表
cxc
最佳模型: PromCSE-RoBERTa-large (0.355B)
评估指标
查看详情
mrpc
最佳模型: BERT-Base
评估指标
查看详情
mrpc-dev
最佳模型: Synthesizer (R+V)
评估指标
查看详情
mteb
最佳模型: AnglE-UAE
评估指标
查看详情
senteval
最佳模型: XLNet-Large
评估指标
查看详情
sick
最佳模型: SRoBERTa-NLI-large
评估指标
查看详情
sts-benchmark
最佳模型: DeBERTa (large)
评估指标
查看详情
sts12
最佳模型: PromptEOL+CSE+OPT-13B
评估指标
查看详情
sts13
最佳模型: PromCSE-RoBERTa-large (0.355B)
评估指标
查看详情
sts14
最佳模型: PromCSE-RoBERTa-large (0.355B)
评估指标
查看详情
sts15
最佳模型: PromptEOL+CSE+LLaMA-30B
评估指标
查看详情
sts16
最佳模型: AnglE-LLaMA-13B
评估指标
查看详情
sick-r
评估指标
查看详情