HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

一个 Token 欺骗LLM法官

一个 Token 欺骗LLM法官

Yulai Zhao, Haolin Liu, Dian Yu, et al.

从一到多：用于3D生成的情境部分潜在变量

从一到多：用于3D生成的情境部分潜在变量

Shaocong Dong, Lihe Ding, Xiao Chen, et al.

开放视觉推理器：将语言认知行为迁移至视觉推理

开放视觉推理器：将语言认知行为迁移至视觉推理

Yana Wei, Liang Zhao, Jianjian Sun, et al.

Lumos-1：从统一模型视角探讨自回归视频生成

Lumos-1：从统一模型视角探讨自回归视频生成

统一多模态

Hangjie Yuan, Weihua Chen, Jun Cen, et al.

神经驱动的图像编辑

神经驱动的图像编辑

Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.

KV缓存引导以诱导小型语言模型的推理能力

KV缓存引导以诱导小型语言模型的推理能力

Max Belitsky, Dawid J. Kopiczko, Michael Dorkenwald, et al.

NeuralOS：基于神经生成模型的操作系统仿真

NeuralOS：基于神经生成模型的操作系统仿真

Luke Rivard, Sun Sun, Hongyu Guo, et al.

CLiFT：用于计算高效和自适应神经渲染的压缩光场标记

CLiFT：用于计算高效和自适应神经渲染的压缩光场标记

机器视觉 3D

Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.

测试时使用反射生成模型进行缩放

测试时使用反射生成模型进行缩放

Zixiao Wang, Yuxin Wang, Xiaorui Wang, et al.

系统建模与优化：一种综合框架用于多式联运移动性

系统建模与优化：一种综合框架用于多式联运移动性

Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.

全原子扩散 Transformers：分子和材料的统一生成建模

全原子扩散 Transformers：分子和材料的统一生成建模

Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.

OST-Bench：评估多模态大语言模型在在线时空场景理解中的能力

OST-Bench：评估多模态大语言模型在在线时空场景理解中的能力

JingLi Lin, Chenming Zhu, Runsen Xu, et al.

可追溯证据增强的视觉基础推理：评估与方法学

可追溯证据增强的视觉基础推理：评估与方法学

Haochen Wang, Xiangtai Li, Zilong Huang, et al.

MIRIX：基于LLM的多智能体记忆系统

MIRIX：基于LLM的多智能体记忆系统

Yu Wang, Xi Chen

Skywork-R1V3 技术报告

Skywork-R1V3 技术报告

Wei Shen, Jiangbo Pei, Yi Peng, et al.

T-LoRA：无需过拟合的单图像扩散模型定制

T-LoRA：无需过拟合的单图像扩散模型定制

Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.

将强化学习应用于长视频

将强化学习应用于长视频

Yukang Chen, Wei Huang, Baifeng Shi, et al.

世界模型的批判

世界模型的批判

Eric Xing, Mingkai Deng, Jinyu Hou, et al.

多样性是否足以实现可扩展的机器人操作？

多样性是否足以实现可扩展的机器人操作？

统一多模态

多任务学习

Modi Shi, Li Chen, Jin Chen, et al.

Nile-Chat：用于阿拉伯文和拉丁字母的埃及语言模型

Nile-Chat：用于阿拉伯文和拉丁字母的埃及语言模型

Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.

GTA1：GUI 测试时缩放代理

GTA1：GUI 测试时缩放代理

Yan Yang, Dongxu Li, Yutong Dai, et al.

MedGen：通过扩展细粒度标注的医学视频来解锁医学视频生成

MedGen：通过扩展细粒度标注的医学视频来解锁医学视频生成

Rongsheng Wang, Junying Chen, Ke Ji, et al.

RLVER：具有可验证情感奖励的强化学习用于共情代理

RLVER：具有可验证情感奖励的强化学习用于共情代理

Peisong Wang, Ruotian Ma, Bang Zhang, et al.

以用户为中心的地理体验：一种基于大型语言模型的增强规划、导航和动态适应框架

以用户为中心的地理体验：一种基于大型语言模型的增强规划、导航和动态适应框架

检索增强生成

Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.

PLAME：利用预训练语言模型生成增强的蛋白质多序列比对

PLAME：利用预训练语言模型生成增强的蛋白质多序列比对

自然语言处理

Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.

CriticLean：基于批评家指导的强化学习用于数学形式化

CriticLean：基于批评家指导的强化学习用于数学形式化

监督式微调

Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.

StreamVLN：通过SlowFast上下文建模实现流式视觉-语言导航

StreamVLN：通过SlowFast上下文建模实现流式视觉-语言导航

Meng Wei, Chenyang Wan, Xiqian Yu, et al.

OmniPart：具有语义解耦和结构凝聚意识的3D生成

OmniPart：具有语义解耦和结构凝聚意识的3D生成

统一多模态

Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.

SingLoRA：使用单矩阵的低秩适应

SingLoRA：使用单矩阵的低秩适应

David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.

潜在推理综述

潜在推理综述

Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.

Agent KB：利用跨领域经验解决代理问题

Agent KB：利用跨领域经验解决代理问题

Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.

基于人类反馈的强化学习训练有益且无害的助手

基于人类反馈的强化学习训练有益且无害的助手

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.

一个 Token 欺骗LLM法官

一个 Token 欺骗LLM法官

Yulai Zhao, Haolin Liu, Dian Yu, et al.

从一到多：用于3D生成的情境部分潜在变量

从一到多：用于3D生成的情境部分潜在变量

Shaocong Dong, Lihe Ding, Xiao Chen, et al.

开放视觉推理器：将语言认知行为迁移至视觉推理

开放视觉推理器：将语言认知行为迁移至视觉推理

Yana Wei, Liang Zhao, Jianjian Sun, et al.

Lumos-1：从统一模型视角探讨自回归视频生成

Lumos-1：从统一模型视角探讨自回归视频生成

统一多模态

Hangjie Yuan, Weihua Chen, Jun Cen, et al.

神经驱动的图像编辑

神经驱动的图像编辑

Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.

KV缓存引导以诱导小型语言模型的推理能力

KV缓存引导以诱导小型语言模型的推理能力

Max Belitsky, Dawid J. Kopiczko, Michael Dorkenwald, et al.

NeuralOS：基于神经生成模型的操作系统仿真

NeuralOS：基于神经生成模型的操作系统仿真

Luke Rivard, Sun Sun, Hongyu Guo, et al.

CLiFT：用于计算高效和自适应神经渲染的压缩光场标记

CLiFT：用于计算高效和自适应神经渲染的压缩光场标记

机器视觉 3D

Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.

测试时使用反射生成模型进行缩放

测试时使用反射生成模型进行缩放

Zixiao Wang, Yuxin Wang, Xiaorui Wang, et al.

系统建模与优化：一种综合框架用于多式联运移动性

系统建模与优化：一种综合框架用于多式联运移动性

Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.

全原子扩散 Transformers：分子和材料的统一生成建模

全原子扩散 Transformers：分子和材料的统一生成建模

Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.

OST-Bench：评估多模态大语言模型在在线时空场景理解中的能力

OST-Bench：评估多模态大语言模型在在线时空场景理解中的能力

JingLi Lin, Chenming Zhu, Runsen Xu, et al.

可追溯证据增强的视觉基础推理：评估与方法学

可追溯证据增强的视觉基础推理：评估与方法学

Haochen Wang, Xiangtai Li, Zilong Huang, et al.

MIRIX：基于LLM的多智能体记忆系统

MIRIX：基于LLM的多智能体记忆系统

Yu Wang, Xi Chen

Skywork-R1V3 技术报告

Skywork-R1V3 技术报告

Wei Shen, Jiangbo Pei, Yi Peng, et al.

T-LoRA：无需过拟合的单图像扩散模型定制

T-LoRA：无需过拟合的单图像扩散模型定制

Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.

将强化学习应用于长视频

将强化学习应用于长视频

Yukang Chen, Wei Huang, Baifeng Shi, et al.

世界模型的批判

世界模型的批判

Eric Xing, Mingkai Deng, Jinyu Hou, et al.

多样性是否足以实现可扩展的机器人操作？

多样性是否足以实现可扩展的机器人操作？

统一多模态

多任务学习

Modi Shi, Li Chen, Jin Chen, et al.

Nile-Chat：用于阿拉伯文和拉丁字母的埃及语言模型

Nile-Chat：用于阿拉伯文和拉丁字母的埃及语言模型

Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.

GTA1：GUI 测试时缩放代理

GTA1：GUI 测试时缩放代理

Yan Yang, Dongxu Li, Yutong Dai, et al.

MedGen：通过扩展细粒度标注的医学视频来解锁医学视频生成

MedGen：通过扩展细粒度标注的医学视频来解锁医学视频生成

Rongsheng Wang, Junying Chen, Ke Ji, et al.

RLVER：具有可验证情感奖励的强化学习用于共情代理

RLVER：具有可验证情感奖励的强化学习用于共情代理

Peisong Wang, Ruotian Ma, Bang Zhang, et al.

以用户为中心的地理体验：一种基于大型语言模型的增强规划、导航和动态适应框架

以用户为中心的地理体验：一种基于大型语言模型的增强规划、导航和动态适应框架

检索增强生成

Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.

PLAME：利用预训练语言模型生成增强的蛋白质多序列比对

PLAME：利用预训练语言模型生成增强的蛋白质多序列比对

自然语言处理

Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.

CriticLean：基于批评家指导的强化学习用于数学形式化

CriticLean：基于批评家指导的强化学习用于数学形式化

监督式微调

Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.

StreamVLN：通过SlowFast上下文建模实现流式视觉-语言导航

StreamVLN：通过SlowFast上下文建模实现流式视觉-语言导航

Meng Wei, Chenyang Wan, Xiqian Yu, et al.

OmniPart：具有语义解耦和结构凝聚意识的3D生成

OmniPart：具有语义解耦和结构凝聚意识的3D生成

统一多模态

Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.

SingLoRA：使用单矩阵的低秩适应

SingLoRA：使用单矩阵的低秩适应

David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.

潜在推理综述

潜在推理综述

Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.

Agent KB：利用跨领域经验解决代理问题

Agent KB：利用跨领域经验解决代理问题

Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.

基于人类反馈的强化学习训练有益且无害的助手

基于人类反馈的强化学习训练有益且无害的助手

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.