HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：面向时空视频迁移的统一框架

OmniTransfer：面向时空视频迁移的统一框架

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

面向高效智能体：记忆、工具学习与规划

面向高效智能体：记忆、工具学习与规划

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

统一多模态

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

机器人技术

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

基于LLM的软件工程问题求解进展与前沿：一项综合调查

基于LLM的软件工程问题求解进展与前沿：一项综合调查

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

为Gemini构建可投入生产的探测器

为Gemini构建可投入生产的探测器

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 技术报告

LFM2 技术报告

检索增强生成

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

Shuai Tan, Biao Gong, Ke Ma, et al.

助手轴：语言模型默认人格的定位与稳定化

助手轴：语言模型默认人格的定位与稳定化

监督式微调

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

Jie Yang, Honglin Guo, Li Ji, et al.

多路思维：通过逐token分支与合并进行推理

多路思维：通过逐token分支与合并进行推理

Yao Tang, Li Dong, Yaru Hao, et al.

推理模型催生“思想百家”

推理模型催生“思想百家”

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

大规模多Agent AI系统发展与问题研究

大规模多Agent AI系统发展与问题研究

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

机器人技术

Linqing Zhong, Yi Liu, Yifei Wei, et al.

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

解锁隐性经验：从文本中合成工具使用轨迹

解锁隐性经验：从文本中合成工具使用轨迹

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

你的组相对优势存在偏差

你的组相对优势存在偏差

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM：通过嵌入模块扩展Transformer

STEM：通过嵌入模块扩展Transformer

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

迷失在噪声中：推理模型在上下文干扰项下的失效机制

迷失在噪声中：推理模型在上下文干扰项下的失效机制

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

超越静态工具：面向科学推理的测试时工具演化

超越静态工具：面向科学推理的测试时工具演化

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE：基于视觉指令的编辑器

VIBE：基于视觉指令的编辑器

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

协作式多Agent测试时强化学习用于推理

协作式多Agent测试时强化学习用于推理

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

基于视觉-语言推理的城市社会语义分割

基于视觉-语言推理的城市社会语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B 技术报告

STEP3-VL-10B 技术报告

多模态表征

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold：扩展生物分子结构预测

SeedFold：扩展生物分子结构预测

Yi Zhou, Chan Lu, Yiming Ma, et al.

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：面向时空视频迁移的统一框架

OmniTransfer：面向时空视频迁移的统一框架

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

面向高效智能体：记忆、工具学习与规划

面向高效智能体：记忆、工具学习与规划

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

统一多模态

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

机器人技术

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

基于LLM的软件工程问题求解进展与前沿：一项综合调查

基于LLM的软件工程问题求解进展与前沿：一项综合调查

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

为Gemini构建可投入生产的探测器

为Gemini构建可投入生产的探测器

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 技术报告

LFM2 技术报告

检索增强生成

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

Shuai Tan, Biao Gong, Ke Ma, et al.

助手轴：语言模型默认人格的定位与稳定化

助手轴：语言模型默认人格的定位与稳定化

监督式微调

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

Jie Yang, Honglin Guo, Li Ji, et al.

多路思维：通过逐token分支与合并进行推理

多路思维：通过逐token分支与合并进行推理

Yao Tang, Li Dong, Yaru Hao, et al.

推理模型催生“思想百家”

推理模型催生“思想百家”

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

大规模多Agent AI系统发展与问题研究

大规模多Agent AI系统发展与问题研究

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

机器人技术

Linqing Zhong, Yi Liu, Yifei Wei, et al.

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

解锁隐性经验：从文本中合成工具使用轨迹

解锁隐性经验：从文本中合成工具使用轨迹

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

你的组相对优势存在偏差

你的组相对优势存在偏差

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM：通过嵌入模块扩展Transformer

STEM：通过嵌入模块扩展Transformer

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

迷失在噪声中：推理模型在上下文干扰项下的失效机制

迷失在噪声中：推理模型在上下文干扰项下的失效机制

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

超越静态工具：面向科学推理的测试时工具演化

超越静态工具：面向科学推理的测试时工具演化

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE：基于视觉指令的编辑器

VIBE：基于视觉指令的编辑器

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

协作式多Agent测试时强化学习用于推理

协作式多Agent测试时强化学习用于推理

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

基于视觉-语言推理的城市社会语义分割

基于视觉-语言推理的城市社会语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B 技术报告

STEP3-VL-10B 技术报告

多模态表征

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold：扩展生物分子结构预测

SeedFold：扩展生物分子结构预测

Yi Zhou, Chan Lu, Yiming Ma, et al.

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.