MMPR-v1.2-Prompts 多模态推理提示语数据集

日期

4 天前

机构

Tsinghua University
上海人工智能实验室

发布地址

huggingface.co

论文链接

2411.10442

许可协议

MIT

下载帮助

MMPR-v1.2-Prompts 是由上海人工智能实验室联合清华大学、复旦大学等机构于 2024 年发布的一个面向多模态推理偏好学习的提示语料集合,相关论文成果为「Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization」,旨在支持模型在复杂的视觉–语言推理任务中的训练与评估。

数据结构

该数据集包含约 300 万个样本,每条数据为一条自然语言文本提示,部分包含多模态约束(例如结合图像与文本的推理要求):

  • 任务指令(Instruction / Prompt):以自然语言表述,涵盖多模态推理场景,例如视觉问答、图文推理、场景理解等。
  • 输入上下文(Context):在部分任务中包含图像、文本或两者结合,用于约束模型生成输出。
  • 输出格式要求(Output Format):提示中对回答形式的限定,如「逐步推理(Chain-of-Thought)」、「多选理由」、「解释型输出」等。

需要注意的是,该数据集本身并不包含模型生成的回答或偏好标注结果,而是作为数据生成的起点,为后续构建多模态偏好排序数据(MMPR 数据集)提供输入提示。