HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

Waver：以波形之姿实现逼真视频生成

Waver：以波形之姿实现逼真视频生成

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

Ming Yin, Dinghan Shen, Silei Xu, et al.

自信地深度思考

自信地深度思考

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3：GUI自动化的基础智能体

Mobile-Agent-v3：GUI自动化的基础智能体

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1：一种科学多模态基础模型

Intern-S1：一种科学多模态基础模型

统一多模态

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

语言引导微调：利用文本反馈增强数值优化

语言引导微调：利用文本反馈增强数值优化

统一多模态

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL：一个用于强化学习环境的人类被试实验的Python库

NiceWebRL：一个用于强化学习环境的人类被试实验的Python库

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

从科学的人工智能到代理科学：自主科学发现综述

从科学的人工智能到代理科学：自主科学发现综述

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder：基于LLM的点云结构化网格代码生成

MeshCoder：基于LLM的点云结构化网格代码生成

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker：扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑

Tinker：扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX：面向未来预测任务的LLM Agent高级实时基准

FutureX：面向未来预测任务的LLM Agent高级实时基准

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO：通过双偏好优化实现可靠的LLM自我验证

DuPO：通过双偏好优化实现可靠的LLM自我验证

监督式微调

Shuaijie She, Yu Bao, Yu Lu, et al.

从分数到能力：一种用于评估金融领域大语言模型的认知诊断框架

从分数到能力：一种用于评估金融领域大语言模型的认知诊断框架

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

Granary：25种欧洲语言的语音识别与翻译数据集

Granary：25种欧洲语言的语音识别与翻译数据集

多任务学习

Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.

TransLLM：通过可学习提示实现城市交通的统一多任务基础框架

TransLLM：通过可学习提示实现城市交通的统一多任务基础框架

多任务学习

Jiaming Leng, Yunying Bi, Chuan Qin, et al.

量化与dLLMs的结合：面向扩散LLM的后训练量化系统性研究

量化与dLLMs的结合：面向扩散LLM的后训练量化系统性研究

Haokun Lin, Haobo Xu, Yichen Wu, et al.

无需训练的文本引导多模态扩散Transformer颜色编辑

无需训练的文本引导多模态扩散Transformer颜色编辑

Zixin Yin, Xili Dai, Ling-Hao Chen, et al.

基于用户画像感知的LLM-as-a-Judge的播客推荐评估

基于用户画像感知的LLM-as-a-Judge的播客推荐评估

Francesco Fabbri, Gustavo Penha, Edoardo D&#39, et al.

MultiRef：基于多个视觉参考的可控图像生成

MultiRef：基于多个视觉参考的可控图像生成

Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.

提示编排标记语言

提示编排标记语言

Yuge Zhang, Nan Chen, Jiahang Xu, et al.

LongSplat：适用于随意长视频的鲁棒非对齐3D高斯点阵

LongSplat：适用于随意长视频的鲁棒非对齐3D高斯点阵

计算机视觉

机器视觉 3D

Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：面向全谱人类偏好评分

HPSv3：面向全谱人类偏好评分

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

说话人去标识系统中的身份泄露评估

说话人去标识系统中的身份泄露评估

音频和语音处理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

下一视觉粒度生成

下一视觉粒度生成

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

4DNeX：轻松实现前馈式4D生成建模

4DNeX：轻松实现前馈式4D生成建模

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

检索增强生成

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

用于宽带计算与通信的集成微波神经网络

用于宽带计算与通信的集成微波神经网络

高性能计算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

GTool：基于大语言模型的图增强工具规划

GTool：基于大语言模型的图增强工具规划

Wenjie Chen, Wenbin Li, Di Yao, et al.

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

Taiping Hu, Haichao Huang, Guobing Zhou, et al.

XQuant：通过KV缓存重计算突破LLM推理的内存墙

XQuant：通过KV缓存重计算突破LLM推理的内存墙

Aditya Tomar, Coleman Hooper, Minjae Lee, et al.

Waver：以波形之姿实现逼真视频生成

Waver：以波形之姿实现逼真视频生成

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

LiveMCP-101：在复杂查询上对MCP增强型Agent进行压力测试与诊断

Ming Yin, Dinghan Shen, Silei Xu, et al.

自信地深度思考

自信地深度思考

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3：GUI自动化的基础智能体

Mobile-Agent-v3：GUI自动化的基础智能体

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1：一种科学多模态基础模型

Intern-S1：一种科学多模态基础模型

统一多模态

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

语言引导微调：利用文本反馈增强数值优化

语言引导微调：利用文本反馈增强数值优化

统一多模态

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL：一个用于强化学习环境的人类被试实验的Python库

NiceWebRL：一个用于强化学习环境的人类被试实验的Python库

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

从科学的人工智能到代理科学：自主科学发现综述

从科学的人工智能到代理科学：自主科学发现综述

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder：基于LLM的点云结构化网格代码生成

MeshCoder：基于LLM的点云结构化网格代码生成

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker：扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑

Tinker：扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX：面向未来预测任务的LLM Agent高级实时基准

FutureX：面向未来预测任务的LLM Agent高级实时基准

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO：通过双偏好优化实现可靠的LLM自我验证

DuPO：通过双偏好优化实现可靠的LLM自我验证

监督式微调

Shuaijie She, Yu Bao, Yu Lu, et al.

从分数到能力：一种用于评估金融领域大语言模型的认知诊断框架

从分数到能力：一种用于评估金融领域大语言模型的认知诊断框架

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

Granary：25种欧洲语言的语音识别与翻译数据集

Granary：25种欧洲语言的语音识别与翻译数据集

多任务学习

Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.

TransLLM：通过可学习提示实现城市交通的统一多任务基础框架

TransLLM：通过可学习提示实现城市交通的统一多任务基础框架

多任务学习

Jiaming Leng, Yunying Bi, Chuan Qin, et al.

量化与dLLMs的结合：面向扩散LLM的后训练量化系统性研究

量化与dLLMs的结合：面向扩散LLM的后训练量化系统性研究

Haokun Lin, Haobo Xu, Yichen Wu, et al.

无需训练的文本引导多模态扩散Transformer颜色编辑

无需训练的文本引导多模态扩散Transformer颜色编辑

Zixin Yin, Xili Dai, Ling-Hao Chen, et al.

基于用户画像感知的LLM-as-a-Judge的播客推荐评估

基于用户画像感知的LLM-as-a-Judge的播客推荐评估

Francesco Fabbri, Gustavo Penha, Edoardo D&#39, et al.

MultiRef：基于多个视觉参考的可控图像生成

MultiRef：基于多个视觉参考的可控图像生成

Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.

提示编排标记语言

提示编排标记语言

Yuge Zhang, Nan Chen, Jiahang Xu, et al.

LongSplat：适用于随意长视频的鲁棒非对齐3D高斯点阵

LongSplat：适用于随意长视频的鲁棒非对齐3D高斯点阵

计算机视觉

机器视觉 3D

Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：面向全谱人类偏好评分

HPSv3：面向全谱人类偏好评分

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

说话人去标识系统中的身份泄露评估

说话人去标识系统中的身份泄露评估

音频和语音处理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

下一视觉粒度生成

下一视觉粒度生成

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

4DNeX：轻松实现前馈式4D生成建模

4DNeX：轻松实现前馈式4D生成建模

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

检索增强生成

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

用于宽带计算与通信的集成微波神经网络

用于宽带计算与通信的集成微波神经网络

高性能计算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

GTool：基于大语言模型的图增强工具规划

GTool：基于大语言模型的图增强工具规划

Wenjie Chen, Wenbin Li, Di Yao, et al.

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

Taiping Hu, Haichao Huang, Guobing Zhou, et al.

XQuant：通过KV缓存重计算突破LLM推理的内存墙

XQuant：通过KV缓存重计算突破LLM推理的内存墙

Aditya Tomar, Coleman Hooper, Minjae Lee, et al.