HyperAI超神经

Visual Question Answering 1

基准测试列表

该任务相关的所有基准测试列表

amber
最佳模型: RLAIF-V 12B

评估指标

查看详情
benchlmm
最佳模型: GPT-4V

评估指标

查看详情
clevr
最佳模型: NeSyCoCo Neuro-Symbolic

评估指标

查看详情
earthvqa
最佳模型: SOBA

评估指标

查看详情
grit
最佳模型: OFA

评估指标

查看详情
mm-vet
最佳模型: Gemini 1.5 Pro (gemini-1.5-pro-002)

评估指标

查看详情
mm-vet-w-o-external-tools
最佳模型: Emu-14B

评估指标

查看详情
mmbench
最佳模型: LLaVA-InternLM2-ViT + MoSLoRA

评估指标

查看详情
msrvtt-qa
最佳模型: Aurora (ours, r=64) Aurora (ours, r=64)

评估指标

查看详情
textvqa-test-standard
最佳模型: PromptCap

评估指标

查看详情
v-bench
最佳模型: IVM-Enhanced GPT4-V

评估指标

查看详情
vip-bench
最佳模型: GPT-4V-turbo-detail:high (Visual Prompt)

评估指标

查看详情
visualmrc
最佳模型: LayoutT5 (Large)

评估指标

查看详情
vizwiz
最佳模型: Emu-I *

评估指标

查看详情
vqa-v2
最佳模型: RLHF-V

评估指标

查看详情
vqa-v2-test-dev
最佳模型: BLIP-2 ViT-G OPT 6.7B (fine-tuned)

评估指标

查看详情
vqa-v2-test-std
最佳模型: LXMERT (low-magnitude pruning)

评估指标

查看详情
coco

评估指标

查看详情
coco-visual-question-answering-vqa-real-2

评估指标

查看详情
gqa

评估指标

查看详情
mapeval-visual

评估指标

查看详情
mm-vet-v2

评估指标

查看详情
mmhal-bench

评估指标

查看详情
msvd-qa

评估指标

查看详情
plotqa-d1

评估指标

查看详情
plotqa-d2

评估指标

查看详情
vqa-v2-val

评估指标

查看详情