HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
MemoryRewardBench:面向大型语言模型长期记忆管理的奖励模型基准测试
基准
偏好
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:面向时空视频迁移的统一框架
视频生成
文生视频
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
面向高效智能体:记忆、工具学习与规划
Agent
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:基于多模态上下文的未来预测评估方法在多模态LLM中的应用
统一多模态
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:面向跨体感泛化的以人为本机器人学习扩展
具身智能
机器人技术
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
基于LLM的软件工程问题求解进展与前沿:一项综合调查
LLM
Agent
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:基于多模态监督的数学推理高效长上下文蒸馏
数据集
推理
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
为Gemini构建可投入生产的探测器
LLM
文本生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技术报告
LLM
检索增强生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:一种用于鲁棒多主体动画的解绑-重绑范式
图生视频
图生图
Shuai Tan, Biao Gong, Ke Ma, et al.
助手轴:语言模型默认人格的定位与稳定化
LLM
监督式微调
Christina Lu, Jack Gallagher, Jonathan Michala, et al.
ABC-Bench:面向真实世界开发中的智能体后端编码基准测试
Agent
基准
Jie Yang, Honglin Guo, Li Ji, et al.
多路思维:通过逐token分支与合并进行推理
推理
算法
Yao Tang, Li Dong, Yaru Hao, et al.
推理模型催生“思想百家”
Agent
推理
Junsol Kim, Shiyang Lai, Nino Scherrer, et al.
大规模多Agent AI系统发展与问题研究
开源
Agent
Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
机器人技术
具身智能
Linqing Zhong, Yi Liu, Yifei Wei, et al.
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
LLM
智能问答
Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
LLM
数据集
Sunzhu Li, Jiale Zhao, Miteto Wei, et al.
解锁隐性经验:从文本中合成工具使用轨迹
LLM
Agent
Zhihao Xu, Rumei Li, Jiahuan Li, et al.
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
人工智能
Agent
Eilam Shapira, Roi Reichart, Moshe Tennenholtz
你的组相对优势存在偏差
强化学习
LLM
Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.
STEM:通过嵌入模块扩展Transformer
Transformer
模型训练
Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.
迷失在噪声中:推理模型在上下文干扰项下的失效机制
基准
推理
Seongyun Lee, Yongrae Jo, Minju Seo, et al.
超越静态工具:面向科学推理的测试时工具演化
Agent
推理
Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.
VIBE:基于视觉指令的编辑器
文生视频
扩散模型
Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.
协作式多Agent测试时强化学习用于推理
Agent
强化学习
Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
强化学习
推理
Zhiyuan Hu, Yucheng Wang, Yufei He, et al.
基于视觉-语言推理的城市社会语义分割
图像分割
语义分割
Yu Wang, Yi Wang, Rui Dai, et al.
STEP3-VL-10B 技术报告
多模态表征
视觉问答
Ailin Huang, Chengyuan Yao, Chunrui Han, et al.
SeedFold:扩展生物分子结构预测
Transformer
蛋白质
Yi Zhou, Chan Lu, Yiming Ma, et al.
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
具身智能
机器人技术
Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
LLM
图像生成
Lijun Liu, Linwei Chen, Zhishou Zhang, et al.
1
2
3
4
5
6
7
49
MemoryRewardBench:面向大型语言模型长期记忆管理的奖励模型基准测试
基准
偏好
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:面向时空视频迁移的统一框架
视频生成
文生视频
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
面向高效智能体:记忆、工具学习与规划
Agent
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:基于多模态上下文的未来预测评估方法在多模态LLM中的应用
统一多模态
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:面向跨体感泛化的以人为本机器人学习扩展
具身智能
机器人技术
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
基于LLM的软件工程问题求解进展与前沿:一项综合调查
LLM
Agent
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:基于多模态监督的数学推理高效长上下文蒸馏
数据集
推理
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
为Gemini构建可投入生产的探测器
LLM
文本生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技术报告
LLM
检索增强生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:一种用于鲁棒多主体动画的解绑-重绑范式
图生视频
图生图
Shuai Tan, Biao Gong, Ke Ma, et al.
助手轴:语言模型默认人格的定位与稳定化
LLM
监督式微调
Christina Lu, Jack Gallagher, Jonathan Michala, et al.
ABC-Bench:面向真实世界开发中的智能体后端编码基准测试
Agent
基准
Jie Yang, Honglin Guo, Li Ji, et al.
多路思维:通过逐token分支与合并进行推理
推理
算法
Yao Tang, Li Dong, Yaru Hao, et al.
推理模型催生“思想百家”
Agent
推理
Junsol Kim, Shiyang Lai, Nino Scherrer, et al.
大规模多Agent AI系统发展与问题研究
开源
Agent
Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
机器人技术
具身智能
Linqing Zhong, Yi Liu, Yifei Wei, et al.
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
LLM
智能问答
Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
LLM
数据集
Sunzhu Li, Jiale Zhao, Miteto Wei, et al.
解锁隐性经验:从文本中合成工具使用轨迹
LLM
Agent
Zhihao Xu, Rumei Li, Jiahuan Li, et al.
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
人工智能
Agent
Eilam Shapira, Roi Reichart, Moshe Tennenholtz
你的组相对优势存在偏差
强化学习
LLM
Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.
STEM:通过嵌入模块扩展Transformer
Transformer
模型训练
Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.
迷失在噪声中:推理模型在上下文干扰项下的失效机制
基准
推理
Seongyun Lee, Yongrae Jo, Minju Seo, et al.
超越静态工具:面向科学推理的测试时工具演化
Agent
推理
Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.
VIBE:基于视觉指令的编辑器
文生视频
扩散模型
Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.
协作式多Agent测试时强化学习用于推理
Agent
强化学习
Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
强化学习
推理
Zhiyuan Hu, Yucheng Wang, Yufei He, et al.
基于视觉-语言推理的城市社会语义分割
图像分割
语义分割
Yu Wang, Yi Wang, Rui Dai, et al.
STEP3-VL-10B 技术报告
多模态表征
视觉问答
Ailin Huang, Chengyuan Yao, Chunrui Han, et al.
SeedFold:扩展生物分子结构预测
Transformer
蛋白质
Yi Zhou, Chan Lu, Yiming Ma, et al.
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
具身智能
机器人技术
Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
LLM
图像生成
Lijun Liu, Linwei Chen, Zhishou Zhang, et al.
1
2
3
4
5
6
7
49