HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
DEEDEE:快速且可扩展的分布外动态检测
强化学习
建模
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
通过Token重排实现更稀疏的块稀疏注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGI的定义
基准
推理
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
从去噪到精炼:一种面向视觉-语言扩散模型的校正框架
扩散模型
多模态
Yatai Ji, Teng Wang, Yuying Ge, et al.
逐步采样,分块优化:面向文本到图像生成的分块级GRPO
文生图
图像生成
Yifu Luo, Penghui Du, Bo Li, et al.
视频作为提示:视频生成的统一语义控制
视频生成
图生视频
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:具备可扩展工具集的通用推理Agent
Agent
推理
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不确定性感知的多目标强化学习引导的扩散模型用于三维从头分子设计
扩散模型
强化学习
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:一种由人工智能驱动的连续流催化反应器发现与优化平台
AI for Science
建模
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:迈向通用结合剂设计
AI for Science
深度学习
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:面向层级规则应用中深度搜索Agent的现实且专家级基准
基准
数据集
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:用于超高分辨率扩散的动态位置外推
扩散模型
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:电影级多镜头长视频叙事的全局生成
文生视频
视频生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:基于显式时空证据的视频推理
视频理解
推理
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:用于高效推测解码器的可选知识蒸馏
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
人类-Agent协同的论文到页面制作成本低于0.1美元
Agent
统一多模态
Qianli Ma, Siyu Wang, Yilin Chen, et al.
从Token化到视觉阅读
多模态
OCR
Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.
用于微调MLLMs的定向推理注入
视觉问答
统一多模态
Chao Huang, Zeliang Zhang, Jiang Liu, et al.
语言模型是单射的,因此可逆
Transformer
自然语言处理
Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.
自由Transformer
Transformer
统一多模态
François Fleuret
基于机器学习的量子处理单元(QPU)处理时间预测
机器学习
模型训练
Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.
量子遍历性边缘的建设性干涉观测
AI for Science
建模
Google Quantum AI and Collaborators
VideoAgentTrek:从无标签视频中进行计算机使用预训练
动作识别
人机交互
Dunjie Lu, Yiheng Xu, Junli Wang, et al.
GigaBrain-0:基于世界模型的视觉-语言-行动模型
具身智能
机器人技术
GigaBrain Team, Angen Ye, Boyuan Wang, et al.
LoongRL:面向长上下文的高级推理强化学习
LLM
推理
Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.
BAPO:通过自适应裁剪的平衡策略优化稳定化LLM的离策略强化学习
强化学习
LLM
Zhiheng Xi, Xin Guo, Yang Nan, et al.
每个Attention都至关重要:一种用于长上下文推理的高效混合架构
Transformer
模型训练
Ling Team, Bin Han, Caizhi Tang, et al.
正确着色:连接感知色彩空间与文本嵌入以提升扩散生成效果
图像修复
扩散模型
Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.
基于视觉-语言模型的自指多视角场景空间推理
视觉问答
多模态
Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.
LoFT:面向开放世界场景中长尾半监督学习的参数高效微调
监督式微调
图像识别
Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.
FLOWER:通过高效的视觉-语言-动作流策略实现通用机器人策略的民主化
LLM
统一多模态
Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.
基于图像修复引导的扩散型大语言模型策略优化
强化学习
扩散模型
Siyan Zhao, Mengchen Liu, Jing Huang, et al.
1
19
20
21
22
23
24
25
49
DEEDEE:快速且可扩展的分布外动态检测
强化学习
建模
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
通过Token重排实现更稀疏的块稀疏注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGI的定义
基准
推理
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
从去噪到精炼:一种面向视觉-语言扩散模型的校正框架
扩散模型
多模态
Yatai Ji, Teng Wang, Yuying Ge, et al.
逐步采样,分块优化:面向文本到图像生成的分块级GRPO
文生图
图像生成
Yifu Luo, Penghui Du, Bo Li, et al.
视频作为提示:视频生成的统一语义控制
视频生成
图生视频
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:具备可扩展工具集的通用推理Agent
Agent
推理
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不确定性感知的多目标强化学习引导的扩散模型用于三维从头分子设计
扩散模型
强化学习
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:一种由人工智能驱动的连续流催化反应器发现与优化平台
AI for Science
建模
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:迈向通用结合剂设计
AI for Science
深度学习
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:面向层级规则应用中深度搜索Agent的现实且专家级基准
基准
数据集
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:用于超高分辨率扩散的动态位置外推
扩散模型
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:电影级多镜头长视频叙事的全局生成
文生视频
视频生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:基于显式时空证据的视频推理
视频理解
推理
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:用于高效推测解码器的可选知识蒸馏
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
人类-Agent协同的论文到页面制作成本低于0.1美元
Agent
统一多模态
Qianli Ma, Siyu Wang, Yilin Chen, et al.
从Token化到视觉阅读
多模态
OCR
Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.
用于微调MLLMs的定向推理注入
视觉问答
统一多模态
Chao Huang, Zeliang Zhang, Jiang Liu, et al.
语言模型是单射的,因此可逆
Transformer
自然语言处理
Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.
自由Transformer
Transformer
统一多模态
François Fleuret
基于机器学习的量子处理单元(QPU)处理时间预测
机器学习
模型训练
Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.
量子遍历性边缘的建设性干涉观测
AI for Science
建模
Google Quantum AI and Collaborators
VideoAgentTrek:从无标签视频中进行计算机使用预训练
动作识别
人机交互
Dunjie Lu, Yiheng Xu, Junli Wang, et al.
GigaBrain-0:基于世界模型的视觉-语言-行动模型
具身智能
机器人技术
GigaBrain Team, Angen Ye, Boyuan Wang, et al.
LoongRL:面向长上下文的高级推理强化学习
LLM
推理
Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.
BAPO:通过自适应裁剪的平衡策略优化稳定化LLM的离策略强化学习
强化学习
LLM
Zhiheng Xi, Xin Guo, Yang Nan, et al.
每个Attention都至关重要:一种用于长上下文推理的高效混合架构
Transformer
模型训练
Ling Team, Bin Han, Caizhi Tang, et al.
正确着色:连接感知色彩空间与文本嵌入以提升扩散生成效果
图像修复
扩散模型
Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.
基于视觉-语言模型的自指多视角场景空间推理
视觉问答
多模态
Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.
LoFT:面向开放世界场景中长尾半监督学习的参数高效微调
监督式微调
图像识别
Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.
FLOWER:通过高效的视觉-语言-动作流策略实现通用机器人策略的民主化
LLM
统一多模态
Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.
基于图像修复引导的扩散型大语言模型策略优化
强化学习
扩散模型
Siyan Zhao, Mengchen Liu, Jing Huang, et al.
1
19
20
21
22
23
24
25
49