HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

π^3: 可扩展的置换等变视觉几何学习

π^3: 可扩展的置换等变视觉几何学习

机器视觉 3D

Yifan Wang, Jianjun Zhou, Haoyi Zhu, et al.

VisionThink：通过强化学习实现智能高效的视觉语言模型

VisionThink：通过强化学习实现智能高效的视觉语言模型

Senqiao Yang, Junyi Li, Xin Lai, et al.

大型语言模型上下文工程综述

大型语言模型上下文工程综述

检索增强生成

Lingrui Mei, Jiayu Yao, Yuyao Ge, et al.

评估机器中适应性世界模型的新游戏方法

评估机器中适应性世界模型的新游戏方法

Lance Ying, Katherine M. Collins, Prafull Sharma, et al.

基于LLM的情感支持对话生成

基于LLM的情感支持对话生成

监督式微调

Shiquan Wang, Ruiyu Fang, Zhongjiang He, et al.

DrafterBench：评估大型语言模型在土木工程任务自动化中的表现

DrafterBench：评估大型语言模型在土木工程任务自动化中的表现

Yinsheng Li, Zhen Dong, Yi Shao

SWE-Perf：语言模型能否优化现实仓库中的代码性能？

SWE-Perf：语言模型能否优化现实仓库中的代码性能？

Xinyi He, Qian Liu, Mingzhe Du, et al.

MOSPA：由空间音频驱动的人类运动生成

MOSPA：由空间音频驱动的人类运动生成

Shuyang Xu, Zhiyang Dou, Mingyi Shi, et al.

MMHU：大规模多模态人类行为理解基准测试

MMHU：大规模多模态人类行为理解基准测试

Renjie Li, Ruijie Ye, Mingyang Wu, et al.

PhysX：基于物理的3D资产生成

PhysX：基于物理的3D资产生成

Ziang Cao, Zhaoxi Chen, Linag Pan, et al.

面向代理的 RAG 与深度推理：LLMs 中 RAG 推理系统的综述

面向代理的 RAG 与深度推理：LLMs 中 RAG 推理系统的综述

检索增强生成

Yangning Li, Weizhi Zhang, Yuyao Yang, et al.

La-Proteina：通过部分潜在流匹配生成原子级蛋白质

La-Proteina：通过部分潜在流匹配生成原子级蛋白质

Tomas Geffner, Kieran Didi, Zhonglin Cao, et al.

SUICA：学习用于空间转录组学的超高维稀疏隐式神经表示

SUICA：学习用于空间转录组学的超高维稀疏隐式神经表示

Qingtian Zhu, Yumin Zheng, Yuling Sang, et al.

XiChen：一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统

XiChen：一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统

Wuxin Wang, Weicheng Ni, Lilan Huang, et al.

AgentsNet：多智能体LLM中的协调与协作推理

AgentsNet：多智能体LLM中的协调与协作推理

Florian Gr\u00f6tschla, Luis M\u00fcller, Jan T\u00f6nshoff, et al.

多模态基础模型能否理解示意图？——科学论文信息检索问答的实证研究

多模态基础模型能否理解示意图？——科学论文信息检索问答的实证研究

Yilun Zhao, Chengye Wang, Chuhan Li, et al.

最优数据混合的比例定律

最优数据混合的比例定律

Mustafa Shukor, Louis Bethune, Dan Busbridge, et al.

主题一致且姿态多样的文本到图像生成

主题一致且姿态多样的文本到图像生成

Zhanxin Gao, Beier Zhu, Liang Yao, et al.

视觉-语言-视觉自动编码器：从扩散模型中进行可扩展的知识蒸馏

视觉-语言-视觉自动编码器：从扩散模型中进行可扩展的知识蒸馏

Tiezheng Zhang, Yitong Li, Yu-cheng Chou, et al.

DuetGraph：基于粗到精的双路径全局-局部融合知识图谱推理

DuetGraph：基于粗到精的双路径全局-局部融合知识图谱推理

Jin Li, Zezhong Ding, Xike Xie

CogDDN: 一种基于认知需求的导航方法，结合决策优化和双重加工思维

CogDDN: 一种基于认知需求的导航方法，结合决策优化和双重加工思维

Yuehao Huang, Liang Liu, Shuangming Lei, et al.

LayerCake: 在大型语言模型层中进行 Token 意识对比解码

LayerCake: 在大型语言模型层中进行 Token 意识对比解码

Jingze Zhu, Yongliang Wu, Wenbo Zhu, et al.

递归混合：学习动态递归深度以适应性地进行 token 级计算

递归混合：学习动态递归深度以适应性地进行 token 级计算

Sangmin Bae, Yujin Kim, Reza Bayat, et al.

REST：通过同时提出多个问题对大型推理模型进行压力测试

REST：通过同时提出多个问题对大型推理模型进行压力测试

Zhuoshi Pan, Qizhi Pei, Yu Li, et al.

EmbRACE-3K：复杂环境中的具身推理与行动

EmbRACE-3K：复杂环境中的具身推理与行动

Mingxian Lin, Wei Huang, Yitang Li, et al.

推理还是记忆？强化学习因数据污染而产生的不可靠结果

推理还是记忆？强化学习因数据污染而产生的不可靠结果

Mingqi Wu, Zhihao Zhang, Qiaole Dong, et al.

SpeakerVid-5M：一个大规模高质量的音频视觉二人互动人类生成数据集

SpeakerVid-5M：一个大规模高质量的音频视觉二人互动人类生成数据集

Youliang Zhang, Zhaoyang Li, Duomin Wang, et al.

VerifyBench：一个跨领域的推理验证系统基准测试

VerifyBench：一个跨领域的推理验证系统基准测试

Xuzhao Li, Xuchen Li, Shiyu Hu, et al.

使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模

使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模

Talal Widatalla, Richard W. Shuai, Brian Hie, et al.

一个 Token 欺骗LLM法官

一个 Token 欺骗LLM法官

Yulai Zhao, Haolin Liu, Dian Yu, et al.

从一到多：用于3D生成的情境部分潜在变量

从一到多：用于3D生成的情境部分潜在变量

Shaocong Dong, Lihe Ding, Xiao Chen, et al.

开放视觉推理器：将语言认知行为迁移至视觉推理

开放视觉推理器：将语言认知行为迁移至视觉推理

Yana Wei, Liang Zhao, Jianjian Sun, et al.

π^3: 可扩展的置换等变视觉几何学习

π^3: 可扩展的置换等变视觉几何学习

机器视觉 3D

Yifan Wang, Jianjun Zhou, Haoyi Zhu, et al.

VisionThink：通过强化学习实现智能高效的视觉语言模型

VisionThink：通过强化学习实现智能高效的视觉语言模型

Senqiao Yang, Junyi Li, Xin Lai, et al.

大型语言模型上下文工程综述

大型语言模型上下文工程综述

检索增强生成

Lingrui Mei, Jiayu Yao, Yuyao Ge, et al.

评估机器中适应性世界模型的新游戏方法

评估机器中适应性世界模型的新游戏方法

Lance Ying, Katherine M. Collins, Prafull Sharma, et al.

基于LLM的情感支持对话生成

基于LLM的情感支持对话生成

监督式微调

Shiquan Wang, Ruiyu Fang, Zhongjiang He, et al.

DrafterBench：评估大型语言模型在土木工程任务自动化中的表现

DrafterBench：评估大型语言模型在土木工程任务自动化中的表现

Yinsheng Li, Zhen Dong, Yi Shao

SWE-Perf：语言模型能否优化现实仓库中的代码性能？

SWE-Perf：语言模型能否优化现实仓库中的代码性能？

Xinyi He, Qian Liu, Mingzhe Du, et al.

MOSPA：由空间音频驱动的人类运动生成

MOSPA：由空间音频驱动的人类运动生成

Shuyang Xu, Zhiyang Dou, Mingyi Shi, et al.

MMHU：大规模多模态人类行为理解基准测试

MMHU：大规模多模态人类行为理解基准测试

Renjie Li, Ruijie Ye, Mingyang Wu, et al.

PhysX：基于物理的3D资产生成

PhysX：基于物理的3D资产生成

Ziang Cao, Zhaoxi Chen, Linag Pan, et al.

面向代理的 RAG 与深度推理：LLMs 中 RAG 推理系统的综述

面向代理的 RAG 与深度推理：LLMs 中 RAG 推理系统的综述

检索增强生成

Yangning Li, Weizhi Zhang, Yuyao Yang, et al.

La-Proteina：通过部分潜在流匹配生成原子级蛋白质

La-Proteina：通过部分潜在流匹配生成原子级蛋白质

Tomas Geffner, Kieran Didi, Zhonglin Cao, et al.

SUICA：学习用于空间转录组学的超高维稀疏隐式神经表示

SUICA：学习用于空间转录组学的超高维稀疏隐式神经表示

Qingtian Zhu, Yumin Zheng, Yuling Sang, et al.

XiChen：一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统

XiChen：一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统

Wuxin Wang, Weicheng Ni, Lilan Huang, et al.

AgentsNet：多智能体LLM中的协调与协作推理

AgentsNet：多智能体LLM中的协调与协作推理

Florian Gr\u00f6tschla, Luis M\u00fcller, Jan T\u00f6nshoff, et al.

多模态基础模型能否理解示意图？——科学论文信息检索问答的实证研究

多模态基础模型能否理解示意图？——科学论文信息检索问答的实证研究

Yilun Zhao, Chengye Wang, Chuhan Li, et al.

最优数据混合的比例定律

最优数据混合的比例定律

Mustafa Shukor, Louis Bethune, Dan Busbridge, et al.

主题一致且姿态多样的文本到图像生成

主题一致且姿态多样的文本到图像生成

Zhanxin Gao, Beier Zhu, Liang Yao, et al.

视觉-语言-视觉自动编码器：从扩散模型中进行可扩展的知识蒸馏

视觉-语言-视觉自动编码器：从扩散模型中进行可扩展的知识蒸馏

Tiezheng Zhang, Yitong Li, Yu-cheng Chou, et al.

DuetGraph：基于粗到精的双路径全局-局部融合知识图谱推理

DuetGraph：基于粗到精的双路径全局-局部融合知识图谱推理

Jin Li, Zezhong Ding, Xike Xie

CogDDN: 一种基于认知需求的导航方法，结合决策优化和双重加工思维

CogDDN: 一种基于认知需求的导航方法，结合决策优化和双重加工思维

Yuehao Huang, Liang Liu, Shuangming Lei, et al.

LayerCake: 在大型语言模型层中进行 Token 意识对比解码

LayerCake: 在大型语言模型层中进行 Token 意识对比解码

Jingze Zhu, Yongliang Wu, Wenbo Zhu, et al.

递归混合：学习动态递归深度以适应性地进行 token 级计算

递归混合：学习动态递归深度以适应性地进行 token 级计算

Sangmin Bae, Yujin Kim, Reza Bayat, et al.

REST：通过同时提出多个问题对大型推理模型进行压力测试

REST：通过同时提出多个问题对大型推理模型进行压力测试

Zhuoshi Pan, Qizhi Pei, Yu Li, et al.

EmbRACE-3K：复杂环境中的具身推理与行动

EmbRACE-3K：复杂环境中的具身推理与行动

Mingxian Lin, Wei Huang, Yitang Li, et al.

推理还是记忆？强化学习因数据污染而产生的不可靠结果

推理还是记忆？强化学习因数据污染而产生的不可靠结果

Mingqi Wu, Zhihao Zhang, Qiaole Dong, et al.

SpeakerVid-5M：一个大规模高质量的音频视觉二人互动人类生成数据集

SpeakerVid-5M：一个大规模高质量的音频视觉二人互动人类生成数据集

Youliang Zhang, Zhaoyang Li, Duomin Wang, et al.

VerifyBench：一个跨领域的推理验证系统基准测试

VerifyBench：一个跨领域的推理验证系统基准测试

Xuzhao Li, Xuchen Li, Shiyu Hu, et al.

使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模

使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模

Talal Widatalla, Richard W. Shuai, Brian Hie, et al.

一个 Token 欺骗LLM法官

一个 Token 欺骗LLM法官

Yulai Zhao, Haolin Liu, Dian Yu, et al.

从一到多：用于3D生成的情境部分潜在变量

从一到多：用于3D生成的情境部分潜在变量

Shaocong Dong, Lihe Ding, Xiao Chen, et al.

开放视觉推理器：将语言认知行为迁移至视觉推理

开放视觉推理器：将语言认知行为迁移至视觉推理

Yana Wei, Liang Zhao, Jianjian Sun, et al.