HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Waver:以波形之姿实现逼真视频生成
图生视频
文生视频
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
基准
Agent
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信地深度思考
推理
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自动化的基础智能体
Agent
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
Intern-S1:一种科学多模态基础模型
多模态
统一多模态
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
语言引导微调:利用文本反馈增强数值优化
统一多模态
LLM
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
NiceWebRL:一个用于强化学习环境的人类被试实验的Python库
强化学习
人机交互
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
从科学的人工智能到代理科学:自主科学发现综述
AI for Science
Agent
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
MeshCoder:基于LLM的点云结构化网格代码生成
代码生成
3D 模型
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
Tinker:扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑
扩散模型
方法/架构
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
FutureX:面向未来预测任务的LLM Agent高级实时基准
基准
LLM
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
DuPO:通过双偏好优化实现可靠的LLM自我验证
监督式微调
偏好
Shuaijie She, Yu Bao, Yu Lu, et al.
从分数到能力:一种用于评估金融领域大语言模型的认知诊断框架
基准
数据集
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
Granary:25种欧洲语言的语音识别与翻译数据集
数据集
多任务学习
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
TransLLM:通过可学习提示实现城市交通的统一多任务基础框架
多任务学习
LLM
Jiaming Leng, Yunying Bi, Chuan Qin, et al.
量化与dLLMs的结合:面向扩散LLM的后训练量化系统性研究
LLM
深度学习
Haokun Lin, Haobo Xu, Yichen Wu, et al.
无需训练的文本引导多模态扩散Transformer颜色编辑
扩散模型
文生图
Zixin Yin, Xili Dai, Ling-Hao Chen, et al.
基于用户画像感知的LLM-as-a-Judge的播客推荐评估
偏好
LLM
Francesco Fabbri, Gustavo Penha, Edoardo D', et al.
MultiRef:基于多个视觉参考的可控图像生成
图像生成
扩散模型
Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.
提示编排标记语言
LLM
智能问答
Yuge Zhang, Nan Chen, Jiahang Xu, et al.
LongSplat:适用于随意长视频的鲁棒非对齐3D高斯点阵
计算机视觉
机器视觉 3D
Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.
多智能体链:通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型
Agent
LLM
Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.
HPSv3:面向全谱人类偏好评分
偏好
文生图
Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.
ComputerRL:面向计算机使用Agent的端到端在线强化学习扩展
强化学习
Agent
Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.
说话人去标识系统中的身份泄露评估
基准
音频和语音处理
Seungmin Seo, Oleg Aulov, Afzal Godil, et al.
下一视觉粒度生成
图像生成
合成
Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.
4DNeX:轻松实现前馈式4D生成建模
视频生成
3D 生成
Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.
ComoRAG:一种面向有状态长篇叙述推理的认知启发式记忆组织RAG
检索增强生成
推理
Juyuan Wang, Rongchen Zhao, Wei Wei, et al.
用于宽带计算与通信的集成微波神经网络
神经网络
高性能计算
Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.
GTool:基于大语言模型的图增强工具规划
LLM
推理
Wenjie Chen, Wenbin Li, Di Yao, et al.
基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测
AI for Science
深度学习
Taiping Hu, Haichao Huang, Guobing Zhou, et al.
XQuant:通过KV缓存重计算突破LLM推理的内存墙
LLM
Transformer
Aditya Tomar, Coleman Hooper, Minjae Lee, et al.
1
32
33
34
35
36
37
38
49
Waver:以波形之姿实现逼真视频生成
图生视频
文生视频
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
基准
Agent
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信地深度思考
推理
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自动化的基础智能体
Agent
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
Intern-S1:一种科学多模态基础模型
多模态
统一多模态
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
语言引导微调:利用文本反馈增强数值优化
统一多模态
LLM
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
NiceWebRL:一个用于强化学习环境的人类被试实验的Python库
强化学习
人机交互
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
从科学的人工智能到代理科学:自主科学发现综述
AI for Science
Agent
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
MeshCoder:基于LLM的点云结构化网格代码生成
代码生成
3D 模型
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
Tinker:扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑
扩散模型
方法/架构
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
FutureX:面向未来预测任务的LLM Agent高级实时基准
基准
LLM
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
DuPO:通过双偏好优化实现可靠的LLM自我验证
监督式微调
偏好
Shuaijie She, Yu Bao, Yu Lu, et al.
从分数到能力:一种用于评估金融领域大语言模型的认知诊断框架
基准
数据集
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
Granary:25种欧洲语言的语音识别与翻译数据集
数据集
多任务学习
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
TransLLM:通过可学习提示实现城市交通的统一多任务基础框架
多任务学习
LLM
Jiaming Leng, Yunying Bi, Chuan Qin, et al.
量化与dLLMs的结合:面向扩散LLM的后训练量化系统性研究
LLM
深度学习
Haokun Lin, Haobo Xu, Yichen Wu, et al.
无需训练的文本引导多模态扩散Transformer颜色编辑
扩散模型
文生图
Zixin Yin, Xili Dai, Ling-Hao Chen, et al.
基于用户画像感知的LLM-as-a-Judge的播客推荐评估
偏好
LLM
Francesco Fabbri, Gustavo Penha, Edoardo D', et al.
MultiRef:基于多个视觉参考的可控图像生成
图像生成
扩散模型
Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.
提示编排标记语言
LLM
智能问答
Yuge Zhang, Nan Chen, Jiahang Xu, et al.
LongSplat:适用于随意长视频的鲁棒非对齐3D高斯点阵
计算机视觉
机器视觉 3D
Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.
多智能体链:通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型
Agent
LLM
Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.
HPSv3:面向全谱人类偏好评分
偏好
文生图
Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.
ComputerRL:面向计算机使用Agent的端到端在线强化学习扩展
强化学习
Agent
Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.
说话人去标识系统中的身份泄露评估
基准
音频和语音处理
Seungmin Seo, Oleg Aulov, Afzal Godil, et al.
下一视觉粒度生成
图像生成
合成
Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.
4DNeX:轻松实现前馈式4D生成建模
视频生成
3D 生成
Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.
ComoRAG:一种面向有状态长篇叙述推理的认知启发式记忆组织RAG
检索增强生成
推理
Juyuan Wang, Rongchen Zhao, Wei Wei, et al.
用于宽带计算与通信的集成微波神经网络
神经网络
高性能计算
Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.
GTool:基于大语言模型的图增强工具规划
LLM
推理
Wenjie Chen, Wenbin Li, Di Yao, et al.
基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测
AI for Science
深度学习
Taiping Hu, Haichao Huang, Guobing Zhou, et al.
XQuant:通过KV缓存重计算突破LLM推理的内存墙
LLM
Transformer
Aditya Tomar, Coleman Hooper, Minjae Lee, et al.
1
32
33
34
35
36
37
38
49