Command Palette
Search for a command to run...
OmniSpatial 全景空间推理基准数据集
OmniSpatial 是由清华大学联合上海期智研究院、上海人工智能实验室等机构于 2025 年发布的一个全景空间推理基准数据集,相关论文成果为「OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models」,旨在填补视觉 – 语言模型空间理解评测的空白。
该数据集包含约 1,533 个图像 – 问答样本,涵盖动态推理(Dynamic Reasoning)、复杂空间逻辑(Complex Spatial Logic)、空间交互(Spatial Interaction)和视角转换(Perspective Taking)四大类空间推理任务,共计 50 个子任务。数据来源多样,涵盖互联网图像、心理学测试与驾驶考试题,标注经多轮审核,保证质量与多样性。与传统基准相比,OmniSpatial 避免了模板化构造,更贴近真实复杂场景,不仅测试基础空间关系(如前后、左右、远近),还强调多物体交互、场景变化和跨视角推理。
该数据集适用于训练与评测多模态大模型的空间推理能力,特别是在智能导航、增强/虚拟现实以及复杂场景理解等应用中,是一个全面而具有挑战性的标准化基准数据集。
OmniSpatial.torrent
做种 2正在下载 0已完成 5总下载次数 27