Image Captioning On Nocaps Out Of Domain
评估指标
CIDEr
SPICE
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | CIDEr | SPICE |
---|---|---|
clipcap-clip-prefix-for-image-captioning | 49.14 | 9.57 |
模型 2 | 21.3 | 7.2 |
clipcap-clip-prefix-for-image-captioning | 49.35 | 9.7 |
模型 4 | 72.13 | 11.53 |
模型 5 | 30.09 | 8.08 |
模型 6 | 26.55 | 7.72 |
模型 7 | 58.48 | 8.77 |
模型 8 | 30.09 | 8.08 |
vivo-surpassing-human-performance-in-novel | 110.14 | 13.74 |
模型 10 | 71.43 | 10.57 |
模型 11 | 48.73 | 8.2 |
模型 12 | 88.54 | 13.87 |
模型 13 | 70.21 | 10.15 |
模型 14 | 103.75 | 13.75 |
模型 15 | 85.18 | 11.18 |
模型 16 | 68.92 | 10.05 |
模型 17 | 87.51 | 12.52 |
模型 18 | 77.39 | 11.59 |
模型 19 | 23.07 | 7.4 |
模型 20 | 68.5 | 10.01 |
模型 21 | 54.56 | 9.9 |
git-a-generative-image-to-text-transformer | 122.27 | 15.62 |
vinvl-making-visual-representations-matter-in | 78.01 | 11.48 |
simvlm-simple-visual-language-model | 109.49 | 13.89 |
模型 25 | 26.25 | 7.52 |
模型 26 | 91.62 | 14.21 |
模型 27 | 87.15 | 11.43 |
模型 28 | 121.69 | 15.13 |
模型 29 | 36.12 | 9.39 |
git-a-generative-image-to-text-transformer | 122.04 | 15.7 |
模型 31 | 39.39 | 7.62 |
模型 32 | 75.39 | 10.68 |
模型 33 | 66.67 | 9.74 |
模型 34 | 43.2 | 9.35 |
模型 35 | 78.91 | 12.14 |
模型 36 | 25.91 | 7.61 |
模型 37 | 73.75 | 9.72 |
pali-a-jointly-scaled-multilingual-language | 126.67 | 15.49 |
模型 39 | 106.55 | 14.21 |
grit-faster-and-better-image-captioning | 72.6 | 11.1 |