HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
GVPO:面向大语言模型后训练的分组方差策略优化
偏好
模型训练
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:面向实时高效协作式具身自主Agent的集成加速
具身智能
机器人技术
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
机器人技术
强化学习
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:通过生成视频中的可操作流实现零样本操控
统一多模态
文生视频
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
合成
数据集
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:基于监督引导的大语言模型文本分类强化学习
监督式微调
强化学习
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
使用PLACER建模蛋白质-小分子构象集合
深度学习
建模
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
Agentic上下文工程:面向自提升语言模型的上下文演化
Agent
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
语音生成
统一多模态
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
目标检测
目标识别
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
在针堆中越狱
LLM
基准
Rishi Rajesh Shah, Chen Henry Wu, Shashwat Saxena, et al.
CritiCal:批判性反馈能否帮助LLM不确定性或置信度校准?
LLM
推理
Qing Zong, Jiayu Liu, Tianshi Zheng, et al.
通过优化文本嵌入缓解大型视觉-语言模型中的幻觉问题
多模态
多模态表征
Aakriti Agrawal, Gouthaman KV, Rohith Aralikatti, et al.
视觉空间调谐
多模态
多模态表征
Rui Yang, Ziyu Zhu, Yanwei Li, et al.
好到不像反派:论LLMs在扮演反派角色时的失败
LLM
数据集
Zihao Yi, Qingxuan Jiang, Ruotian Ma, et al.
DeepEyesV2:迈向代理型多模态模型
Agent
LLM
Jack Hong, Chenxiao Zhao, ChengLin Zhu, et al.
基于机器学习的连续血糖监测用于识别代谢亚表型并指导精准生活方式干预
深度学习
建模
Ahmed A. Metwally, Heyjun Park, Yue Wu, et al.
在测试阶段重用预训练数据是一种计算倍增器
LLM
检索增强生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
多模态
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:评估LLM工具使用Agent在动态环境中多轮成本最优规划与适应性
Agent
基准
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
寒武纪-S:迈向视频中的空间超感知
视频理解
多模态
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
通过经验合成实现Agent学习的扩展
强化学习
Agent
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:与图像交互的思考
推理
Agent
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
基于视频的思考:视频生成作为一种有前景的多模态推理范式
视频生成
多模态
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
Amber生物分子模拟的最新进展
蛋白质
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:基于大规模高质量数据集增强UHR图像合成
文生图
扩散模型
Chen Zhao, En Ci, Yunzhe Xu, et al.
从五个维度到众多维度:大型语言模型作为精准且可解释的心理画像工具
LLM
推理
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
基于节点的多模态生成:文本、音频、图像与视频
多模态
多模态表征
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:基于符号世界模型的具身LLM多Agent协作中的动态推理与学习
Agent
推理
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:用于表格上下文学习的多尺度稀疏注意力
Transformer
深度学习
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:用于表格基础模型推理与微调的统一库
监督式微调
基准
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技术报告
语音生成
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
1
16
17
18
19
20
21
22
49
GVPO:面向大语言模型后训练的分组方差策略优化
偏好
模型训练
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:面向实时高效协作式具身自主Agent的集成加速
具身智能
机器人技术
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
机器人技术
强化学习
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:通过生成视频中的可操作流实现零样本操控
统一多模态
文生视频
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
合成
数据集
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:基于监督引导的大语言模型文本分类强化学习
监督式微调
强化学习
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
使用PLACER建模蛋白质-小分子构象集合
深度学习
建模
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
Agentic上下文工程:面向自提升语言模型的上下文演化
Agent
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
语音生成
统一多模态
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
目标检测
目标识别
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
在针堆中越狱
LLM
基准
Rishi Rajesh Shah, Chen Henry Wu, Shashwat Saxena, et al.
CritiCal:批判性反馈能否帮助LLM不确定性或置信度校准?
LLM
推理
Qing Zong, Jiayu Liu, Tianshi Zheng, et al.
通过优化文本嵌入缓解大型视觉-语言模型中的幻觉问题
多模态
多模态表征
Aakriti Agrawal, Gouthaman KV, Rohith Aralikatti, et al.
视觉空间调谐
多模态
多模态表征
Rui Yang, Ziyu Zhu, Yanwei Li, et al.
好到不像反派:论LLMs在扮演反派角色时的失败
LLM
数据集
Zihao Yi, Qingxuan Jiang, Ruotian Ma, et al.
DeepEyesV2:迈向代理型多模态模型
Agent
LLM
Jack Hong, Chenxiao Zhao, ChengLin Zhu, et al.
基于机器学习的连续血糖监测用于识别代谢亚表型并指导精准生活方式干预
深度学习
建模
Ahmed A. Metwally, Heyjun Park, Yue Wu, et al.
在测试阶段重用预训练数据是一种计算倍增器
LLM
检索增强生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
多模态
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:评估LLM工具使用Agent在动态环境中多轮成本最优规划与适应性
Agent
基准
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
寒武纪-S:迈向视频中的空间超感知
视频理解
多模态
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
通过经验合成实现Agent学习的扩展
强化学习
Agent
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:与图像交互的思考
推理
Agent
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
基于视频的思考:视频生成作为一种有前景的多模态推理范式
视频生成
多模态
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
Amber生物分子模拟的最新进展
蛋白质
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:基于大规模高质量数据集增强UHR图像合成
文生图
扩散模型
Chen Zhao, En Ci, Yunzhe Xu, et al.
从五个维度到众多维度:大型语言模型作为精准且可解释的心理画像工具
LLM
推理
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
基于节点的多模态生成:文本、音频、图像与视频
多模态
多模态表征
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:基于符号世界模型的具身LLM多Agent协作中的动态推理与学习
Agent
推理
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:用于表格上下文学习的多尺度稀疏注意力
Transformer
深度学习
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:用于表格基础模型推理与微调的统一库
监督式微调
基准
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技术报告
语音生成
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
1
16
17
18
19
20
21
22
49