Meta发布新世界模型V-JEPA 2,实现高效规划与操作,速度超越NVIDIA Cosmos 30倍
Meta公司最近发布了一款名为V-JEPA 2的新版开源世界模型,其运行速度比英伟达的Cosmos模型快30倍。这款模型的创新之处在于它能够在没有样本数据、特殊训练或奖励机制的情况下,通过网络数据和少量机器互动数据自我监督学习,从而在物理世界中进行有效的规划和决策。 V-JEPA 2的设计理念是在全新的环境中实现目标导向的机器人规划。Meta团队在Franka机器人的实验平台上展示了V-JEPA 2-AC(行动条件版本)如何通过图像目标完成物体捡取和放置的任务,而无需任何预设的数据集或奖励信号。这一技术突破展示了从网络数据和有限的实际交互中,如何培养出能够自主适应物理环境的世界模型。 与其他机器人模型一样,V-JEPA 2也存在局限性。例如,在预测动作时没有使用摄像头参数,依赖手动调整找到最佳的摄像角度;而误差累积和搜索空间爆炸问题则导致无法高效完成复杂或长时间的任务。尽管如此,Meta的研究团队仍然认为这是一个重要的里程碑,表明了自监督学习在机器人领域的巨大潜力。 此外,Meta团队还探索了多种JEPA模型,通过多种感官进行预测,包括视觉、听觉和触觉等。这种多模态的自我监督学习方式不仅提高了模型的鲁棒性和泛化能力,也为未来更加智能的机器人应用奠定了基础。 Meta此次公开V-JEPA 2模型及相关研究成果,体现了该公司在推动人工智能领域开放创新方面的持续努力。V-JEPA 2的发布不仅是技术上的突破,也进一步促进了学术界和工业界的交流与合作,共同推进机器人技术的发展。 业内人士普遍认为,Meta发布的V-JEPA 2是机器人技术领域的一个重大进步,标志着多模态自监督学习在实际应用中的巨大潜力。特别是V-JEPA 2在无样本数据和无特殊训练条件下的表现,显示了其在减少机器人学习成本方面的优势,有助于推动机器人技术的更广泛应用和发展。Meta作为全球领先的互联网公司之一,长期以来致力于人工智能技术的研发与推广,此次成果再次证明了其在这方面的领先地位和技术实力。