HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

WebSight：一种面向视觉的鲁棒网络智能体架构

WebSight：一种面向视觉的鲁棒网络智能体架构

统一多模态

Tanvir Bhathal, Asanshay Gupta

UltraMemV2：面向120B参数的内存网络，具备卓越的长上下文学习能力

UltraMemV2：面向120B参数的内存网络，具备卓越的长上下文学习能力

Zihao Huang, Yu Bao, Qiyang Min, et al.

赫尔墨斯4 技术报告

赫尔墨斯4 技术报告

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

OmniHuman-1.5：通过认知模拟为虚拟化身注入主动思维

OmniHuman-1.5：通过认知模拟为虚拟化身注入主动思维

多模态表征

Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.

VoxHammer：无需训练的原生3D空间中精确且连贯的3D编辑

VoxHammer：无需训练的原生3D空间中精确且连贯的3D编辑

Lin Li, Zehuan Huang, Haoran Feng, et al.

CMPhysBench：用于评估大语言模型在凝聚态物理领域性能的基准测试

CMPhysBench：用于评估大语言模型在凝聚态物理领域性能的基准测试

Weida Wang, Dongchen Huang, Jiatong Li, et al.

TreePO：基于启发式树建模弥合策略优化与有效性及推理效率之间的差距

TreePO：基于启发式树建模弥合策略优化与有效性及推理效率之间的差距

Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.

Nemotron-CC-Math：一个1330亿token规模的高质量数学预训练数据集

Nemotron-CC-Math：一个1330亿token规模的高质量数学预训练数据集

Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.

理解工具集成推理

理解工具集成推理

Heng Lin, Zhongwen Xu

Spacer：面向工程化科学灵感

Spacer：面向工程化科学灵感

Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.

超越记忆：通过循环、记忆与测试时计算扩展实现推理深度延伸

超越记忆：通过循环、记忆与测试时计算扩展实现推理深度延伸

Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.

VibeVoice 技术报告

VibeVoice 技术报告

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok：面向视觉语言模型高效推理的多模态覆盖最大化

MMTok：面向视觉语言模型高效推理的多模态覆盖最大化

多模态表征

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG：检索增强的多视角扩散模型

MV-RAG：检索增强的多视角扩散模型

Yosef Dayani, Omer Benishu, Sagie Benaim

利用多模态机器学习将金属有机框架合成与应用相连接

利用多模态机器学习将金属有机框架合成与应用相连接

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

自适应传输系统中的模型上下文协议：一项综述

自适应传输系统中的模型上下文协议：一项综述

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

多集体的算法集体行动

多集体的算法集体行动

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA：面向计算机使用智能体的开源基础

OpenCUA：面向计算机使用智能体的开源基础

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

空间策略：基于空间感知建模与推理引导视觉-运动机器人操作

空间策略：基于空间感知建模与推理引导视觉-运动机器人操作

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron：基于后神经架构搜索的高效语言模型

Jet-Nemotron：基于后神经架构搜索的高效语言模型

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP：通过稀疏自编码器实现的持久概念遗忘

CRISP：通过稀疏自编码器实现的持久概念遗忘

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

弱监督可操作性定位中的选择性对比学习

弱监督可操作性定位中的选择性对比学习

计算机视觉

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin：第一人称视角下的身体与视图梦境

EgoTwin：第一人称视角下的身体与视图梦境

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

超越Pass@1：基于变分问题生成的自对弈持续提升RLVR

超越Pass@1：基于变分问题生成的自对弈持续提升RLVR

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY：面向长时程任务的开放世界四足动物探索与操作

ODYSSEY：面向长时程任务的开放世界四足动物探索与操作

统一多模态

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly：在不微调LLM的情况下微调LLM Agent

AgentFly：在不微调LLM的情况下微调LLM Agent

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

约束引导的扩散推理器用于神经符号学习

约束引导的扩散推理器用于神经符号学习

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

基于LLM的智能体在药物资产尽职调查中的竞争格局映射

基于LLM的智能体在药物资产尽职调查中的竞争格局映射

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen：单图像3D场景生成的一次前向传播

SceneGen：单图像3D场景生成的一次前向传播

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

大语言模型基准测试综述

大语言模型基准测试综述

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver：以波形之姿实现逼真视频生成

Waver：以波形之姿实现逼真视频生成

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

Ming Yin, Dinghan Shen, Silei Xu, et al.

WebSight：一种面向视觉的鲁棒网络智能体架构

WebSight：一种面向视觉的鲁棒网络智能体架构

统一多模态

Tanvir Bhathal, Asanshay Gupta

UltraMemV2：面向120B参数的内存网络，具备卓越的长上下文学习能力

UltraMemV2：面向120B参数的内存网络，具备卓越的长上下文学习能力

Zihao Huang, Yu Bao, Qiyang Min, et al.

赫尔墨斯4 技术报告

赫尔墨斯4 技术报告

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

OmniHuman-1.5：通过认知模拟为虚拟化身注入主动思维

OmniHuman-1.5：通过认知模拟为虚拟化身注入主动思维

多模态表征

Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.

VoxHammer：无需训练的原生3D空间中精确且连贯的3D编辑

VoxHammer：无需训练的原生3D空间中精确且连贯的3D编辑

Lin Li, Zehuan Huang, Haoran Feng, et al.

CMPhysBench：用于评估大语言模型在凝聚态物理领域性能的基准测试

CMPhysBench：用于评估大语言模型在凝聚态物理领域性能的基准测试

Weida Wang, Dongchen Huang, Jiatong Li, et al.

TreePO：基于启发式树建模弥合策略优化与有效性及推理效率之间的差距

TreePO：基于启发式树建模弥合策略优化与有效性及推理效率之间的差距

Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.

Nemotron-CC-Math：一个1330亿token规模的高质量数学预训练数据集

Nemotron-CC-Math：一个1330亿token规模的高质量数学预训练数据集

Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.

理解工具集成推理

理解工具集成推理

Heng Lin, Zhongwen Xu

Spacer：面向工程化科学灵感

Spacer：面向工程化科学灵感

Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.

超越记忆：通过循环、记忆与测试时计算扩展实现推理深度延伸

超越记忆：通过循环、记忆与测试时计算扩展实现推理深度延伸

Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.

VibeVoice 技术报告

VibeVoice 技术报告

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok：面向视觉语言模型高效推理的多模态覆盖最大化

MMTok：面向视觉语言模型高效推理的多模态覆盖最大化

多模态表征

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG：检索增强的多视角扩散模型

MV-RAG：检索增强的多视角扩散模型

Yosef Dayani, Omer Benishu, Sagie Benaim

利用多模态机器学习将金属有机框架合成与应用相连接

利用多模态机器学习将金属有机框架合成与应用相连接

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

自适应传输系统中的模型上下文协议：一项综述

自适应传输系统中的模型上下文协议：一项综述

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

多集体的算法集体行动

多集体的算法集体行动

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA：面向计算机使用智能体的开源基础

OpenCUA：面向计算机使用智能体的开源基础

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

空间策略：基于空间感知建模与推理引导视觉-运动机器人操作

空间策略：基于空间感知建模与推理引导视觉-运动机器人操作

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron：基于后神经架构搜索的高效语言模型

Jet-Nemotron：基于后神经架构搜索的高效语言模型

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP：通过稀疏自编码器实现的持久概念遗忘

CRISP：通过稀疏自编码器实现的持久概念遗忘

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

弱监督可操作性定位中的选择性对比学习

弱监督可操作性定位中的选择性对比学习

计算机视觉

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin：第一人称视角下的身体与视图梦境

EgoTwin：第一人称视角下的身体与视图梦境

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

超越Pass@1：基于变分问题生成的自对弈持续提升RLVR

超越Pass@1：基于变分问题生成的自对弈持续提升RLVR

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY：面向长时程任务的开放世界四足动物探索与操作

ODYSSEY：面向长时程任务的开放世界四足动物探索与操作

统一多模态

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly：在不微调LLM的情况下微调LLM Agent

AgentFly：在不微调LLM的情况下微调LLM Agent

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

约束引导的扩散推理器用于神经符号学习

约束引导的扩散推理器用于神经符号学习

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

基于LLM的智能体在药物资产尽职调查中的竞争格局映射

基于LLM的智能体在药物资产尽职调查中的竞争格局映射

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen：单图像3D场景生成的一次前向传播

SceneGen：单图像3D场景生成的一次前向传播

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

大语言模型基准测试综述

大语言模型基准测试综述

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver：以波形之姿实现逼真视频生成

Waver：以波形之姿实现逼真视频生成

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

Ming Yin, Dinghan Shen, Silei Xu, et al.