HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 数学推理数据集

日期

22 天前

数据集组织

NVIDIA(英伟达)

论文 URL

2512.15489

许可证

CC BY-SA 4.0

Nemotron-Math-v2 是一个由 NVIDIA Corporation 于 2025 年发布的数学推理数据集,相关文论成果为 Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision 。主要用于训练 LLM 以执行结构化数学推理,研究工具增强的推理与纯语言推理的差异,以及构建长语境或多轨迹推理系统等。

该数据集包含约 34.7 万个高质量数学问题和 700 万个模型生成的推理轨迹。每个问题在六种配置下进行求解:高 / 中 / 低推理深度与是否使用 Python TIR,答案通过 LLM 作为裁判的管道进行验证。

数据字段:

  • problem: 从 OpenMathReasoning 和 Math StackExchange 等来源提取的问题陈述
  • messages: 用户和助手的对话记录,用于 LLM 训练
  • expected_answer: 提取的答案或模型生成的多数投票答案
  • metadata: 不同推理和工具使用情况下的通过率
  • data_source: 数据来源 AoPS 或 StackExchange-Math
  • tool: 使用的工具定义,或为空

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供