HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
AlphaEarth Foundations:一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型
AI for Science
遥感
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
基于可解释深度学习模型的长时序ENSO预测
深度学习
卷积神经网络
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:面向科学计算的基础模型构建
AI for Science
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:通过有效的强化学习和精确的推理期对齐推进GUI代理
监督式微调
多模态
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:一种双流显式语义引导的多变量时间序列预测框架
LLM
自然语言处理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
当 Tokens 讲得太多:跨图像、视频和音频的多模态长上下文 Tokens 压缩综述
Transformer
计算机视觉
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker:一个为本地部署原生训练的高效大型语言模型家族
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
重建4D空间智能:一项综述
计算机视觉
视频理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:释放表示层任务显著性在多任务学习中的潜力
多任务学习
神经网络
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:现实世界短视频的结构化视频理解
视频理解
视频描述
Yuying Ge, Yixiao Ge, Chen Li, et al.
Agent 强化策略优化
强化学习
Agent
Guanting Dong, Hangyu Mao, Kai Ma, et al.
SciToolAgent:一个基于知识图谱的科学Agent,用于多工具集成
检索增强生成
LLM
Keyan Ding, Jing Yu, Junjie Huang, et al.
规范自校正:通过测试时优化缓解上下文奖励黑客行为
LLM
DeepSeek
Víctor Gallego
PRIX:从原始图像中学习规划用于端到端自动驾驶
自动驾驶
计算机视觉
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
与人工智能聊天:实时视频通信从人类到人工智能的意外转变
多模态
视频理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI:面向GUI代理的分层多平台评估框架
基准
Agent
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
深度研究者与测试时扩散
检索增强生成
推理
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
LLM量化几何:GPTQ作为Babai的最近平面算法
LLM
算法
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:一种可扩展的基于提示的医学图像质量评估基础模型
医学影像
多模态
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: 计算机使用代理在广度和深度上能走多远?
Agent
基准
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
分层预算策略优化用于自适应推理
强化学习
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
《电影导演:面向短片生成》
文生视频
统一多模态
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
LAPO:通过长度自适应策略优化内化推理效率
推理
LLM
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
MUR:基于动量不确定性的大语言模型推理
LLM
推理
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
NABLA:邻域自适应块级注意力
Transformer
视频生成
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
组序列策略优化
强化学习
LLM
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
olmOCR:利用视觉语言模型解锁PDF中的数万亿个Token
文档理解
多模态
Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.
SafeWork-R1: 在AI-45法则下的安全与智能协同进化
推理
多模态
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
解耦大语言模型中的知识与推理:基于认知双系统理论的探索
LLM
推理
Mutian Yang, Jiandong Gao, Ji Wu
Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证:关于Dafny的初步研究
监督式微调
LLM
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
RAVine:现实对齐的代理搜索评估
检索增强生成
Agent
Yilong Xu, Xiang Long, Zhi Zheng, et al.
“一个领域能否帮助其他领域?”基于数据的多领域强化学习推理研究
强化学习
LLM
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
1
37
38
39
40
41
42
43
49
AlphaEarth Foundations:一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型
AI for Science
遥感
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
基于可解释深度学习模型的长时序ENSO预测
深度学习
卷积神经网络
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:面向科学计算的基础模型构建
AI for Science
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:通过有效的强化学习和精确的推理期对齐推进GUI代理
监督式微调
多模态
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:一种双流显式语义引导的多变量时间序列预测框架
LLM
自然语言处理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
当 Tokens 讲得太多:跨图像、视频和音频的多模态长上下文 Tokens 压缩综述
Transformer
计算机视觉
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker:一个为本地部署原生训练的高效大型语言模型家族
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
重建4D空间智能:一项综述
计算机视觉
视频理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:释放表示层任务显著性在多任务学习中的潜力
多任务学习
神经网络
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:现实世界短视频的结构化视频理解
视频理解
视频描述
Yuying Ge, Yixiao Ge, Chen Li, et al.
Agent 强化策略优化
强化学习
Agent
Guanting Dong, Hangyu Mao, Kai Ma, et al.
SciToolAgent:一个基于知识图谱的科学Agent,用于多工具集成
检索增强生成
LLM
Keyan Ding, Jing Yu, Junjie Huang, et al.
规范自校正:通过测试时优化缓解上下文奖励黑客行为
LLM
DeepSeek
Víctor Gallego
PRIX:从原始图像中学习规划用于端到端自动驾驶
自动驾驶
计算机视觉
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
与人工智能聊天:实时视频通信从人类到人工智能的意外转变
多模态
视频理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI:面向GUI代理的分层多平台评估框架
基准
Agent
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
深度研究者与测试时扩散
检索增强生成
推理
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
LLM量化几何:GPTQ作为Babai的最近平面算法
LLM
算法
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:一种可扩展的基于提示的医学图像质量评估基础模型
医学影像
多模态
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: 计算机使用代理在广度和深度上能走多远?
Agent
基准
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
分层预算策略优化用于自适应推理
强化学习
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
《电影导演:面向短片生成》
文生视频
统一多模态
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
LAPO:通过长度自适应策略优化内化推理效率
推理
LLM
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
MUR:基于动量不确定性的大语言模型推理
LLM
推理
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
NABLA:邻域自适应块级注意力
Transformer
视频生成
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
组序列策略优化
强化学习
LLM
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
olmOCR:利用视觉语言模型解锁PDF中的数万亿个Token
文档理解
多模态
Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.
SafeWork-R1: 在AI-45法则下的安全与智能协同进化
推理
多模态
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
解耦大语言模型中的知识与推理:基于认知双系统理论的探索
LLM
推理
Mutian Yang, Jiandong Gao, Ji Wu
Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证:关于Dafny的初步研究
监督式微调
LLM
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
RAVine:现实对齐的代理搜索评估
检索增强生成
Agent
Yilong Xu, Xiang Long, Zhi Zheng, et al.
“一个领域能否帮助其他领域?”基于数据的多领域强化学习推理研究
强化学习
LLM
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
1
37
38
39
40
41
42
43
49