HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

针对闭源MLLM的对抗攻击通过特征最优对齐

针对闭源MLLM的对抗攻击通过特征最优对齐

多模态表征

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief：探索去中心化GRPO中的攻击与防御

Hail to the Thief：探索去中心化GRPO中的攻击与防御

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

大语言模型的黑盒策略蒸馏

大语言模型的黑盒策略蒸馏

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：面向开源下一代视频通用智能体的通用视频代理

UniVA：面向开源下一代视频通用智能体的通用视频代理

统一多模态

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：一种通用、可交互且长时程世界模拟的世界模型

PAN：一种通用、可交互且长时程世界模拟的世界模型

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：基于结构识别关系三元组范式的文档解析

MonkeyOCR：基于结构识别关系三元组范式的文档解析

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

更安全的生成式AI的共识采样

更安全的生成式AI的共识采样

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：面向端到端ADS的韧性导向安全保证框架

Argus：面向端到端ADS的韧性导向安全保证框架

Dingji Wang, You Lu, Bihuan Chen, et al.

基于世界模型的策略优化用于视觉-语言-动作模型

基于世界模型的策略优化用于视觉-语言-动作模型

机器人技术

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

超越事实检索：基于生成语义空间的RAG情景记忆

超越事实检索：基于生成语义空间的RAG情景记忆

检索增强生成

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

TiDAR：在扩散中思考，在自回归中表达

TiDAR：在扩散中思考，在自回归中表达

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Assaf Singer, Noam Rotstein, Amir Mann, et al.

Lumine：在3D开放世界中构建通用Agent的开源方案

Lumine：在3D开放世界中构建通用Agent的开源方案

Weihao Tan, Xiangyang Li, Yunhao Fang, et al.

从1,000个词生成一张图像：通过结构化描述增强文本到图像生成

从1,000个词生成一张图像：通过结构化描述增强文本到图像生成

Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.

KLASS：基于KL引导的掩码扩散模型快速推理

KLASS：基于KL引导的掩码扩散模型快速推理

自然语言处理

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.

基于人类示范的计算机使用Agent定位

基于人类示范的计算机使用Agent定位

Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.

Wasm：构建结构化阿拉伯语交错多模态语料库的流水线

Wasm：构建结构化阿拉伯语交错多模态语料库的流水线

Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.

对话系统中的自适应多智能体响应优化

对话系统中的自适应多智能体响应优化

Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.

SPAN：单目3D目标检测中的空间投影对齐

SPAN：单目3D目标检测中的空间投影对齐

机器视觉 3D

Yifan Wang, Yian Zhao, Fanqi Pu, et al.

高维系统伏尔泰拉级数的高效近似

高维系统伏尔泰拉级数的高效近似

Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley

SofT-GRPO：通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习

SofT-GRPO：通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习

Zhi Zheng, Wee Sun Lee

RedOne 2.0：重新思考社交网络服务中的领域特定LLM后训练

RedOne 2.0：重新思考社交网络服务中的领域特定LLM后训练

监督式微调

Fei Zhao, Chonggang Lu, Haofu Qian, et al.

车站：一个用于AI驱动发现的开放世界环境

车站：一个用于AI驱动发现的开放世界环境

Stephen Chung, Wenyu Du

DRIVE：面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践

DRIVE：面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践

监督式微调

Speed Zhu, Jianwei Cai, Guang Chen, et al.

IterResearch：通过马尔可夫状态重构重新思考长时域Agent

IterResearch：通过马尔可夫状态重构重新思考长时域Agent

Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.

HaluMem：评估Agent记忆系统中的幻觉

HaluMem：评估Agent记忆系统中的幻觉

Ding Chen, Simin Niu, Kehang Li, et al.

GVPO：面向大语言模型后训练的分组方差策略优化

GVPO：面向大语言模型后训练的分组方差策略优化

Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.

ReCA：面向实时高效协作式具身自主Agent的集成加速

ReCA：面向实时高效协作式具身自主Agent的集成加速

机器人技术

Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.

DexFlyWheel：一种可扩展且自提升的灵巧操作数据生成框架

DexFlyWheel：一种可扩展且自提升的灵巧操作数据生成框架

机器人技术

Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.

针对闭源MLLM的对抗攻击通过特征最优对齐

针对闭源MLLM的对抗攻击通过特征最优对齐

多模态表征

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief：探索去中心化GRPO中的攻击与防御

Hail to the Thief：探索去中心化GRPO中的攻击与防御

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

大语言模型的黑盒策略蒸馏

大语言模型的黑盒策略蒸馏

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：面向开源下一代视频通用智能体的通用视频代理

UniVA：面向开源下一代视频通用智能体的通用视频代理

统一多模态

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：一种通用、可交互且长时程世界模拟的世界模型

PAN：一种通用、可交互且长时程世界模拟的世界模型

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：基于结构识别关系三元组范式的文档解析

MonkeyOCR：基于结构识别关系三元组范式的文档解析

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

更安全的生成式AI的共识采样

更安全的生成式AI的共识采样

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：面向端到端ADS的韧性导向安全保证框架

Argus：面向端到端ADS的韧性导向安全保证框架

Dingji Wang, You Lu, Bihuan Chen, et al.

基于世界模型的策略优化用于视觉-语言-动作模型

基于世界模型的策略优化用于视觉-语言-动作模型

机器人技术

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

超越事实检索：基于生成语义空间的RAG情景记忆

超越事实检索：基于生成语义空间的RAG情景记忆

检索增强生成

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

TiDAR：在扩散中思考，在自回归中表达

TiDAR：在扩散中思考，在自回归中表达

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Assaf Singer, Noam Rotstein, Amir Mann, et al.

Lumine：在3D开放世界中构建通用Agent的开源方案

Lumine：在3D开放世界中构建通用Agent的开源方案

Weihao Tan, Xiangyang Li, Yunhao Fang, et al.

从1,000个词生成一张图像：通过结构化描述增强文本到图像生成

从1,000个词生成一张图像：通过结构化描述增强文本到图像生成

Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.

KLASS：基于KL引导的掩码扩散模型快速推理

KLASS：基于KL引导的掩码扩散模型快速推理

自然语言处理

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.

基于人类示范的计算机使用Agent定位

基于人类示范的计算机使用Agent定位

Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.

Wasm：构建结构化阿拉伯语交错多模态语料库的流水线

Wasm：构建结构化阿拉伯语交错多模态语料库的流水线

Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.

对话系统中的自适应多智能体响应优化

对话系统中的自适应多智能体响应优化

Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.

SPAN：单目3D目标检测中的空间投影对齐

SPAN：单目3D目标检测中的空间投影对齐

机器视觉 3D

Yifan Wang, Yian Zhao, Fanqi Pu, et al.

高维系统伏尔泰拉级数的高效近似

高维系统伏尔泰拉级数的高效近似

Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley

SofT-GRPO：通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习

SofT-GRPO：通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习

Zhi Zheng, Wee Sun Lee

RedOne 2.0：重新思考社交网络服务中的领域特定LLM后训练

RedOne 2.0：重新思考社交网络服务中的领域特定LLM后训练

监督式微调

Fei Zhao, Chonggang Lu, Haofu Qian, et al.

车站：一个用于AI驱动发现的开放世界环境

车站：一个用于AI驱动发现的开放世界环境

Stephen Chung, Wenyu Du

DRIVE：面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践

DRIVE：面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践

监督式微调

Speed Zhu, Jianwei Cai, Guang Chen, et al.

IterResearch：通过马尔可夫状态重构重新思考长时域Agent

IterResearch：通过马尔可夫状态重构重新思考长时域Agent

Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.

HaluMem：评估Agent记忆系统中的幻觉

HaluMem：评估Agent记忆系统中的幻觉

Ding Chen, Simin Niu, Kehang Li, et al.

GVPO：面向大语言模型后训练的分组方差策略优化

GVPO：面向大语言模型后训练的分组方差策略优化

Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.

ReCA：面向实时高效协作式具身自主Agent的集成加速

ReCA：面向实时高效协作式具身自主Agent的集成加速

机器人技术

Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.

DexFlyWheel：一种可扩展且自提升的灵巧操作数据生成框架

DexFlyWheel：一种可扩展且自提升的灵巧操作数据生成框架

机器人技术

Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.