日期

5 个月前

大小

106.5 GB

数据集组织

论文 URL

2411.10442

许可证

MIT

标签

模型训练

MMPR-v1.2-Prompts 是由上海人工智能实验室联合清华大学、复旦大学等机构于 2024 年发布的一个面向多模态推理偏好学习的提示语料集合，相关论文成果为「Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization」，旨在支持模型在复杂的视觉–语言推理任务中的训练与评估。

数据结构

该数据集包含约 300 万个样本，每条数据为一条自然语言文本提示，部分包含多模态约束（例如结合图像与文本的推理要求）：

任务指令（Instruction / Prompt）：以自然语言表述，涵盖多模态推理场景，例如视觉问答、图文推理、场景理解等。
输入上下文（Context）：在部分任务中包含图像、文本或两者结合，用于约束模型生成输出。
输出格式要求（Output Format）：提示中对回答形式的限定，如「逐步推理（Chain-of-Thought）」、「多选理由」、「解释型输出」等。

需要注意的是，该数据集本身并不包含模型生成的回答或偏好标注结果，而是作为数据生成的起点，为后续构建多模态偏好排序数据（MMPR 数据集）提供输入提示。

MMPR-v1.2-prompts.torrent

做种 1正在下载 0已完成 1总下载量 64

MMPR-v1.2-prompts/
- README.md
  2.05 KB
- README.txt
  4.09 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

下载

在 Discord 上讨论

日期

5 个月前

大小

106.5 GB

数据集组织

论文 URL

2411.10442

许可证

MIT

标签

模型训练

数据结构

该数据集包含约 300 万个样本，每条数据为一条自然语言文本提示，部分包含多模态约束（例如结合图像与文本的推理要求）：

任务指令（Instruction / Prompt）：以自然语言表述，涵盖多模态推理场景，例如视觉问答、图文推理、场景理解等。
输入上下文（Context）：在部分任务中包含图像、文本或两者结合，用于约束模型生成输出。
输出格式要求（Output Format）：提示中对回答形式的限定，如「逐步推理（Chain-of-Thought）」、「多选理由」、「解释型输出」等。

MMPR-v1.2-prompts.torrent

做种 1正在下载 0已完成 1总下载量 64

MMPR-v1.2-prompts/
- README.md
  2.05 KB
- README.txt
  4.09 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

MeshCoder 结构化 3D 物体-代码数据集

3 个月前

VERA 语音推理评测数据集

3 个月前

2.37 GB59

UNO-Bench 全模态评测基准数据集

3 个月前

9.71 GB69

Spatial-SSRL-81k 空间感知自监督数据集

2 个月前

FrontierScience 推理科研任务评测数据集

2 个月前

DetectiumFire 多模态火灾理解数据集

2 个月前

IF-Bench 红外图像理解基准数据集

2 个月前

VideoRewardBench 视频奖励模型评测数据集

2 个月前

HumanSense Benchmark 人体感知基准数据集

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

MMPR-v1.2-Prompts 多模态推理提示语数据集

数据结构

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMPR-v1.2-Prompts 多模态推理提示语数据集

数据结构

相关数据集

MeshCoder 结构化 3D 物体-代码数据集

VERA 语音推理评测数据集

UNO-Bench 全模态评测基准数据集

Spatial-SSRL-81k 空间感知自监督数据集

FrontierScience 推理科研任务评测数据集

DetectiumFire 多模态火灾理解数据集

IF-Bench 红外图像理解基准数据集

VideoRewardBench 视频奖励模型评测数据集

HumanSense Benchmark 人体感知基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMPR-v1.2-Prompts 多模态推理提示语数据集

数据结构

相关数据集

MeshCoder 结构化 3D 物体-代码数据集

VERA 语音推理评测数据集

UNO-Bench 全模态评测基准数据集

Spatial-SSRL-81k 空间感知自监督数据集

FrontierScience 推理科研任务评测数据集

DetectiumFire 多模态火灾理解数据集

IF-Bench 红外图像理解基准数据集

VideoRewardBench 视频奖励模型评测数据集

HumanSense Benchmark 人体感知基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MeshCoder 结构化 3D 物体-代码数据集

VERA 语音推理评测数据集

UNO-Bench 全模态评测基准数据集

Spatial-SSRL-81k 空间感知自监督数据集

FrontierScience 推理科研任务评测数据集

DetectiumFire 多模态火灾理解数据集

IF-Bench 红外图像理解基准数据集

VideoRewardBench 视频奖励模型评测数据集

HumanSense Benchmark 人体感知基准数据集

相关数据集

MeshCoder 结构化 3D 物体-代码数据集

VERA 语音推理评测数据集

UNO-Bench 全模态评测基准数据集

Spatial-SSRL-81k 空间感知自监督数据集

FrontierScience 推理科研任务评测数据集

DetectiumFire 多模态火灾理解数据集

IF-Bench 红外图像理解基准数据集

VideoRewardBench 视频奖励模型评测数据集

HumanSense Benchmark 人体感知基准数据集