HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.

EcoMapper：面向气候的卫星影像生成建模

EcoMapper：面向气候的卫星影像生成建模

Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

计算机视觉

Lin, Yunlong, Lin, et al.

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

Long Xing, Qidong Huang, Xiaoyi Dong, et al.

GRPO-CARE：多模态推理中的一致性感知强化学习

GRPO-CARE：多模态推理中的一致性感知强化学习

Chen, Yi, Ge, et al.

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.

矩阵游戏：互动世界基础模型

矩阵游戏：互动世界基础模型

Yifan Zhang, Chunli Peng, Boyang Wang, et al.

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

Zehuan Huang, Haoran Feng, Yangtian Sun, et al.

基于学习的无人机高效视觉主动跟踪飞行目标方法

基于学习的无人机高效视觉主动跟踪飞行目标方法

Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

机器人技术

计算机视觉

Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

监督式微调

Jiaru Zou, Ling Yang, Jingwen Gu, et al.

Phantom-Data：面向通用主题一致的视频生成数据集

Phantom-Data：面向通用主题一致的视频生成数据集

Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.

RLPR：将RLVR外推至无需验证器的一般领域

RLPR：将RLVR外推至无需验证器的一般领域

Tianyu Yu, Bo Ji, Shouli Wang, et al.

LongWriter-Zero：通过强化学习掌握超长文本生成

LongWriter-Zero：通过强化学习掌握超长文本生成

Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.

法线之光：通用光度立体的统一特征表示

法线之光：通用光度立体的统一特征表示

计算机视觉

Hong Li, Houyuan Chen, Chongjie Ye, et al.

利用STATE预测细胞在不同环境下对扰动的反应

利用STATE预测细胞在不同环境下对扰动的反应

Abhinav K. Adduri, Dhruv Gautam, Beatrice Bevilacqua, et al.

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

机器人技术

Guang Yin, Yitong Li, Yixuan Wang, et al.

优化多语言文本转语音技术以包含口音和情感

优化多语言文本转语音技术以包含口音和情感

统一多模态

Pawar, Pranav, Dwivedi, et al.

VIKI-R：通过强化学习协调具身多智能体合作

VIKI-R：通过强化学习协调具身多智能体合作

Kang, Li, Song, et al.

PAROAttention：面向模式的重排序以提高视觉生成模型中稀疏和量化注意力机制的效率

PAROAttention：面向模式的重排序以提高视觉生成模型中稀疏和量化注意力机制的效率

Zhao, Tianchen, Hong, et al.

视觉引导的分块是你所需要的：增强RAG的多模态文档理解

视觉引导的分块是你所需要的：增强RAG的多模态文档理解

检索增强生成

Tripathi, Vishesh, Odapally, et al.

拖放式LLM：零样本提示到权重

拖放式LLM：零样本提示到权重

Liang, Zhiyuan, Tang, et al.

进化缓存加速现成扩散模型

进化缓存加速现成扩散模型

Aggarwal, Anirud, Shrivastava, et al.

RE-IMAGINE：用于推理评估的符号基准合成

RE-IMAGINE：用于推理评估的符号基准合成

Xu, Xinnuo, Lawrence, et al.

SonicVerse：基于音乐特征的多任务学习字幕生成

SonicVerse：基于音乐特征的多任务学习字幕生成

Chopra, Anuradha, Roy, et al.

并非一切尽失：无需检查点的LLM恢复

并非一切尽失：无需检查点的LLM恢复

Blagoev, Nikolay, Ersoy, et al.

日晷：一系列功能强大的时间序列基础模型

日晷：一系列功能强大的时间序列基础模型

Yong Liu, Guo Qin, Zhiyuan Shi, et al.

ADRD：基于规则决策系统的LLM驱动自主驾驶

ADRD：基于规则决策系统的LLM驱动自主驾驶

Fanzhi Zeng, Siqi Wang, Chuzhao Zhu, et al.

改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成

改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成

Chengzhi Xu, Yuyang Wang, Lai Wei, et al.

Show-O2：改进的原生统一多模态模型

Show-O2：改进的原生统一多模态模型

统一多模态

多模态表征

Jinheng Xie, Zhenheng Yang, Mike Zheng Shou

从跨领域视角重新审视强化学习在大语言模型推理中的应用

从跨领域视角重新审视强化学习在大语言模型推理中的应用

Zhoujun Cheng, Shibo Hao, Tianyang Liu, et al.

Raptor：利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入

Raptor：利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入

Ulzee An, Moonseong Jeong, Simon Austin Lee, et al.

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.

EcoMapper：面向气候的卫星影像生成建模

EcoMapper：面向气候的卫星影像生成建模

Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

计算机视觉

Lin, Yunlong, Lin, et al.

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

Long Xing, Qidong Huang, Xiaoyi Dong, et al.

GRPO-CARE：多模态推理中的一致性感知强化学习

GRPO-CARE：多模态推理中的一致性感知强化学习

Chen, Yi, Ge, et al.

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.

矩阵游戏：互动世界基础模型

矩阵游戏：互动世界基础模型

Yifan Zhang, Chunli Peng, Boyang Wang, et al.

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

Zehuan Huang, Haoran Feng, Yangtian Sun, et al.

基于学习的无人机高效视觉主动跟踪飞行目标方法

基于学习的无人机高效视觉主动跟踪飞行目标方法

Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

机器人技术

计算机视觉

Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

监督式微调

Jiaru Zou, Ling Yang, Jingwen Gu, et al.

Phantom-Data：面向通用主题一致的视频生成数据集

Phantom-Data：面向通用主题一致的视频生成数据集

Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.

RLPR：将RLVR外推至无需验证器的一般领域

RLPR：将RLVR外推至无需验证器的一般领域

Tianyu Yu, Bo Ji, Shouli Wang, et al.

LongWriter-Zero：通过强化学习掌握超长文本生成

LongWriter-Zero：通过强化学习掌握超长文本生成

Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.

法线之光：通用光度立体的统一特征表示

法线之光：通用光度立体的统一特征表示

计算机视觉

Hong Li, Houyuan Chen, Chongjie Ye, et al.

利用STATE预测细胞在不同环境下对扰动的反应

利用STATE预测细胞在不同环境下对扰动的反应

Abhinav K. Adduri, Dhruv Gautam, Beatrice Bevilacqua, et al.

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

机器人技术

Guang Yin, Yitong Li, Yixuan Wang, et al.

优化多语言文本转语音技术以包含口音和情感

优化多语言文本转语音技术以包含口音和情感

统一多模态

Pawar, Pranav, Dwivedi, et al.

VIKI-R：通过强化学习协调具身多智能体合作

VIKI-R：通过强化学习协调具身多智能体合作

Kang, Li, Song, et al.

PAROAttention：面向模式的重排序以提高视觉生成模型中稀疏和量化注意力机制的效率

PAROAttention：面向模式的重排序以提高视觉生成模型中稀疏和量化注意力机制的效率

Zhao, Tianchen, Hong, et al.

视觉引导的分块是你所需要的：增强RAG的多模态文档理解

视觉引导的分块是你所需要的：增强RAG的多模态文档理解

检索增强生成

Tripathi, Vishesh, Odapally, et al.

拖放式LLM：零样本提示到权重

拖放式LLM：零样本提示到权重

Liang, Zhiyuan, Tang, et al.

进化缓存加速现成扩散模型

进化缓存加速现成扩散模型

Aggarwal, Anirud, Shrivastava, et al.

RE-IMAGINE：用于推理评估的符号基准合成

RE-IMAGINE：用于推理评估的符号基准合成

Xu, Xinnuo, Lawrence, et al.

SonicVerse：基于音乐特征的多任务学习字幕生成

SonicVerse：基于音乐特征的多任务学习字幕生成

Chopra, Anuradha, Roy, et al.

并非一切尽失：无需检查点的LLM恢复

并非一切尽失：无需检查点的LLM恢复

Blagoev, Nikolay, Ersoy, et al.

日晷：一系列功能强大的时间序列基础模型

日晷：一系列功能强大的时间序列基础模型

Yong Liu, Guo Qin, Zhiyuan Shi, et al.

ADRD：基于规则决策系统的LLM驱动自主驾驶

ADRD：基于规则决策系统的LLM驱动自主驾驶

Fanzhi Zeng, Siqi Wang, Chuzhao Zhu, et al.

改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成

改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成

Chengzhi Xu, Yuyang Wang, Lai Wei, et al.

Show-O2：改进的原生统一多模态模型

Show-O2：改进的原生统一多模态模型

统一多模态

多模态表征

Jinheng Xie, Zhenheng Yang, Mike Zheng Shou

从跨领域视角重新审视强化学习在大语言模型推理中的应用

从跨领域视角重新审视强化学习在大语言模型推理中的应用

Zhoujun Cheng, Shibo Hao, Tianyang Liu, et al.

Raptor：利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入

Raptor：利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入

Ulzee An, Moonseong Jeong, Simon Austin Lee, et al.