日期

6 个月前

大小

5.63 GB

发布 URL

www.kaggle.com

论文 URL

2507.13405

许可证

Apache 2.0

标签

基准

COREVQA 是由 Algoverse 人工智能研究中心于 2025 年发布的一个视觉问答基准数据集，相关论文成果为「COREVQA: A Crowd Observation and Reasoning Entailment Visual Question Answering Benchmark」，旨在评估视觉语言模型（VLM）在人群场景中的推理蕴含能力。

该数据集包含 5,608 对图像与真/假语句对，图像源自 CrowdHuman 数据集。数据以真实拥挤场景为主，强调遮挡、视角变化与背景干扰等难点，旨在推动 VLM 在复杂社会场景下的细粒度感知与推理能力。

数据包含：

场景图像（image_id）
自然语言陈述（question）
二分类标签（answer:TRUE / FALSE）

COREVQA.torrent

做种 1正在下载 0已完成 32总下载量 124

COREVQA/
- README.md
  1.42 KB
- README.txt
  2.85 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

下载

在 Discord 上讨论

日期

6 个月前

大小

5.63 GB

发布 URL

www.kaggle.com

论文 URL

2507.13405

许可证

Apache 2.0

标签

基准

数据包含：

场景图像（image_id）
自然语言陈述（question）
二分类标签（answer:TRUE / FALSE）

COREVQA.torrent

做种 1正在下载 0已完成 32总下载量 124

COREVQA/
- README.md
  1.42 KB
- README.txt
  2.85 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

UNO-Bench 全模态评测基准数据集

3 个月前

9.71 GB69

HumanSense Benchmark 人体感知基准数据集

3 个月前

OpenGU 图遗忘综合评测数据集

2 个月前

MUVR 多模态非裁剪视频检索基准

2 个月前

IF-Bench 红外图像理解基准数据集

2 个月前

CL-bench 上下文学习评估基准

6 天前

VenusBench-GD 跨平台界面理解数据集

1 个月前

GroundingME 复杂场景理解评测数据集

1 个月前

WeatherBench 恶劣天气图像恢复数据集

1 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

COREVQA 视觉问答基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

COREVQA 视觉问答基准数据集

相关数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

IF-Bench 红外图像理解基准数据集

CL-bench 上下文学习评估基准

VenusBench-GD 跨平台界面理解数据集

GroundingME 复杂场景理解评测数据集

WeatherBench 恶劣天气图像恢复数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

COREVQA 视觉问答基准数据集

相关数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

IF-Bench 红外图像理解基准数据集

CL-bench 上下文学习评估基准

VenusBench-GD 跨平台界面理解数据集

GroundingME 复杂场景理解评测数据集

WeatherBench 恶劣天气图像恢复数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

IF-Bench 红外图像理解基准数据集

CL-bench 上下文学习评估基准

VenusBench-GD 跨平台界面理解数据集

GroundingME 复杂场景理解评测数据集

WeatherBench 恶劣天气图像恢复数据集

相关数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

IF-Bench 红外图像理解基准数据集

CL-bench 上下文学习评估基准

VenusBench-GD 跨平台界面理解数据集

GroundingME 复杂场景理解评测数据集

WeatherBench 恶劣天气图像恢复数据集