HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

基于可解释深度学习模型的长时序ENSO预测

基于可解释深度学习模型的长时序ENSO预测

卷积神经网络

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：面向科学计算的基础模型构建

OmniArch：面向科学计算的基础模型构建

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

监督式微调

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：一种双流显式语义引导的多变量时间序列预测框架

DualSG：一种双流显式语义引导的多变量时间序列预测框架

自然语言处理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

计算机视觉

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

重建4D空间智能：一项综述

重建4D空间智能：一项综述

计算机视觉

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

多任务学习

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agent 强化策略优化

Agent 强化策略优化

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

检索增强生成

Keyan Ding, Jing Yu, Junjie Huang, et al.

规范自校正：通过测试时优化缓解上下文奖励黑客行为

规范自校正：通过测试时优化缓解上下文奖励黑客行为

Víctor Gallego

PRIX：从原始图像中学习规划用于端到端自动驾驶

PRIX：从原始图像中学习规划用于端到端自动驾驶

计算机视觉

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI：面向GUI代理的分层多平台评估框架

MMBench-GUI：面向GUI代理的分层多平台评估框架

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

深度研究者与测试时扩散

检索增强生成

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM量化几何：GPTQ作为Babai的最近平面算法

LLM量化几何：GPTQ作为Babai的最近平面算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: 计算机使用代理在广度和深度上能走多远？

OS-MAP: 计算机使用代理在广度和深度上能走多远？

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

分层预算策略优化用于自适应推理

分层预算策略优化用于自适应推理

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

《电影导演：面向短片生成》

《电影导演：面向短片生成》

统一多模态

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

LAPO：通过长度自适应策略优化内化推理效率

LAPO：通过长度自适应策略优化内化推理效率

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

MUR：基于动量不确定性的大语言模型推理

MUR：基于动量不确定性的大语言模型推理

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

NABLA：邻域自适应块级注意力

NABLA：邻域自适应块级注意力

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

组序列策略优化

组序列策略优化

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

Mutian Yang, Jiandong Gao, Ji Wu

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

监督式微调

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

RAVine：现实对齐的代理搜索评估

RAVine：现实对齐的代理搜索评估

检索增强生成

Yilong Xu, Xiang Long, Zhi Zheng, et al.

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

Yu Li, Zhuoshi Pan, Honglin Lin, et al.

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

基于可解释深度学习模型的长时序ENSO预测

基于可解释深度学习模型的长时序ENSO预测

卷积神经网络

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：面向科学计算的基础模型构建

OmniArch：面向科学计算的基础模型构建

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

监督式微调

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：一种双流显式语义引导的多变量时间序列预测框架

DualSG：一种双流显式语义引导的多变量时间序列预测框架

自然语言处理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

计算机视觉

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

重建4D空间智能：一项综述

重建4D空间智能：一项综述

计算机视觉

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

多任务学习

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agent 强化策略优化

Agent 强化策略优化

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

检索增强生成

Keyan Ding, Jing Yu, Junjie Huang, et al.

规范自校正：通过测试时优化缓解上下文奖励黑客行为

规范自校正：通过测试时优化缓解上下文奖励黑客行为

Víctor Gallego

PRIX：从原始图像中学习规划用于端到端自动驾驶

PRIX：从原始图像中学习规划用于端到端自动驾驶

计算机视觉

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI：面向GUI代理的分层多平台评估框架

MMBench-GUI：面向GUI代理的分层多平台评估框架

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

深度研究者与测试时扩散

检索增强生成

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM量化几何：GPTQ作为Babai的最近平面算法

LLM量化几何：GPTQ作为Babai的最近平面算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: 计算机使用代理在广度和深度上能走多远？

OS-MAP: 计算机使用代理在广度和深度上能走多远？

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

分层预算策略优化用于自适应推理

分层预算策略优化用于自适应推理

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

《电影导演：面向短片生成》

《电影导演：面向短片生成》

统一多模态

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

LAPO：通过长度自适应策略优化内化推理效率

LAPO：通过长度自适应策略优化内化推理效率

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

MUR：基于动量不确定性的大语言模型推理

MUR：基于动量不确定性的大语言模型推理

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

NABLA：邻域自适应块级注意力

NABLA：邻域自适应块级注意力

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

组序列策略优化

组序列策略优化

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

Mutian Yang, Jiandong Gao, Ji Wu

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

监督式微调

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

RAVine：现实对齐的代理搜索评估

RAVine：现实对齐的代理搜索评估

检索增强生成

Yilong Xu, Xiang Long, Zhi Zheng, et al.

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

Yu Li, Zhuoshi Pan, Honglin Lin, et al.