HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

数学推理是否提升通用大语言模型的能力？理解大语言模型推理的可迁移性

数学推理是否提升通用大语言模型的能力？理解大语言模型推理的可迁移性

监督式微调

Maggie Huan, Yuetai Li, Tuney Zheng, et al.

SciArena：科学文献任务中基础模型的开放评估平台

SciArena：科学文献任务中基础模型的开放评估平台

Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.

医学中的整体人工智能：性能提升与可解释性增强

医学中的整体人工智能：性能提升与可解释性增强

多模态表征

Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.

evolving prompts in-context: 一种开放式的、自我复制的视角

evolving prompts in-context: 一种开放式的、自我复制的视角

Wang, Jianyu, Hu, et al.

SPIRAL：零和博弈中的自我对弈通过多智能体多轮强化学习激励推理

SPIRAL：零和博弈中的自我对弈通过多智能体多轮强化学习激励推理

Bo Liu, Leon Guertler, Simon Yu, et al.

面向听者的奖励性思考在视觉语言模型中的图像偏好研究

面向听者的奖励性思考在视觉语言模型中的图像偏好研究

Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.

Calligrapher：自由风格文本图像定制

Calligrapher：自由风格文本图像定制

Yue Ma, Qingyan Bai, Hao Ouyang, et al.

VMoBA：视频扩散模型中的块注意力混合方法

VMoBA：视频扩散模型中的块注意力混合方法

Jianzong Wu, Liang Hou, Haotian Yang, et al.

SMMILE：一种专家驱动的多模态医学情境学习基准

SMMILE：一种专家驱动的多模态医学情境学习基准

Melanie Rieff, Maya Varma, Ossian Rabow, et al.

自动LLM速通基准：重现NanoGPT改进

自动LLM速通基准：重现NanoGPT改进

Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.

Shape-for-Motion：基于3D代理的精确一致视频编辑

Shape-for-Motion：基于3D代理的精确一致视频编辑

Yuhao Liu, Tengfei Wang, Fang Liu, et al.

从理想到现实：面向实际场景的统一且数据高效的密集预测

从理想到现实：面向实际场景的统一且数据高效的密集预测

多任务学习

Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.

ShotBench：视觉-语言模型中的专家级电影理解

ShotBench：视觉-语言模型中的专家级电影理解

Hongbo Liu, Jingwen He, Yi Jin, et al.

XVerse：通过DiT调制实现一致的多主体身份和语义属性控制

XVerse：通过DiT调制实现一致的多主体身份和语义属性控制

Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.

24孔板中的零样本抗体设计

24孔板中的零样本抗体设计

Chai Discovery Team

KinFormer：适用于催化有机反应动力学的通用动态符号回归

KinFormer：适用于催化有机反应动力学的通用动态符号回归

Jindou Chen, Jidong Tian, Liang Wu, et al.

MiCo：多图像对比强化视觉推理

MiCo：多图像对比强化视觉推理

Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.

细粒度偏好优化改进了VLM中的空间推理能力

细粒度偏好优化改进了VLM中的空间推理能力

Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.

Ark：一个基于Python的开源机器人学习框架

Ark：一个基于Python的开源机器人学习框架

机器人技术

Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.

Pangu Pro MoE：分组专家混合以实现高效的稀疏性

Pangu Pro MoE：分组专家混合以实现高效的稀疏性

Tang, Yehui, Li, et al.

LLaVA-Scissor：基于语义连通分量的视频大语言模型中的令牌压缩

LLaVA-Scissor：基于语义连通分量的视频大语言模型中的令牌压缩

Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.

BlenderFusion：基于3D的视觉编辑与生成合成

BlenderFusion：基于3D的视觉编辑与生成合成

Chen, Jiacheng, Mehran, et al.

UniMate：一种统一的机械超材料生成、性能预测及条件确认模型

UniMate：一种统一的机械超材料生成、性能预测及条件确认模型

多任务学习

Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.

学习跳过Transformer的中间层

学习跳过Transformer的中间层

Tim Lawson, Laurence Aitchison

SAM4D：在相机和激光雷达流中分割任何物体

SAM4D：在相机和激光雷达流中分割任何物体

Jianyun Xu, Song Wang, Ziqian Ni, et al.

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

自然语言处理

Ziyue Li, Chenrui Fan, Tianyi Zhou

FineWeb2：一管通天下——适应每种语言的预训练数据处理

FineWeb2：一管通天下——适应每种语言的预训练数据处理

Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.

MADrive：增强记忆的驾驶场景建模

MADrive：增强记忆的驾驶场景建模

计算机视觉

Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

Advait Gupta, Rishie Raj, Dang Nguyen, et al.

Mind2Web 2：评估代理搜索中的代理作为评判者

Mind2Web 2：评估代理搜索中的代理作为评判者

检索增强生成

Boyu Gou, Zanming Huang, Yuting Ning, et al.

WorldVLA：迈向自回归动作世界模型

WorldVLA：迈向自回归动作世界模型

Jun Cen, Chaohui Yu, Hangjie Yuan, et al.

ReCode：利用强化学习更新代码API知识

ReCode：利用强化学习更新代码API知识

Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.

数学推理是否提升通用大语言模型的能力？理解大语言模型推理的可迁移性

数学推理是否提升通用大语言模型的能力？理解大语言模型推理的可迁移性

监督式微调

Maggie Huan, Yuetai Li, Tuney Zheng, et al.

SciArena：科学文献任务中基础模型的开放评估平台

SciArena：科学文献任务中基础模型的开放评估平台

Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.

医学中的整体人工智能：性能提升与可解释性增强

医学中的整体人工智能：性能提升与可解释性增强

多模态表征

Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.

evolving prompts in-context: 一种开放式的、自我复制的视角

evolving prompts in-context: 一种开放式的、自我复制的视角

Wang, Jianyu, Hu, et al.

SPIRAL：零和博弈中的自我对弈通过多智能体多轮强化学习激励推理

SPIRAL：零和博弈中的自我对弈通过多智能体多轮强化学习激励推理

Bo Liu, Leon Guertler, Simon Yu, et al.

面向听者的奖励性思考在视觉语言模型中的图像偏好研究

面向听者的奖励性思考在视觉语言模型中的图像偏好研究

Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.

Calligrapher：自由风格文本图像定制

Calligrapher：自由风格文本图像定制

Yue Ma, Qingyan Bai, Hao Ouyang, et al.

VMoBA：视频扩散模型中的块注意力混合方法

VMoBA：视频扩散模型中的块注意力混合方法

Jianzong Wu, Liang Hou, Haotian Yang, et al.

SMMILE：一种专家驱动的多模态医学情境学习基准

SMMILE：一种专家驱动的多模态医学情境学习基准

Melanie Rieff, Maya Varma, Ossian Rabow, et al.

自动LLM速通基准：重现NanoGPT改进

自动LLM速通基准：重现NanoGPT改进

Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.

Shape-for-Motion：基于3D代理的精确一致视频编辑

Shape-for-Motion：基于3D代理的精确一致视频编辑

Yuhao Liu, Tengfei Wang, Fang Liu, et al.

从理想到现实：面向实际场景的统一且数据高效的密集预测

从理想到现实：面向实际场景的统一且数据高效的密集预测

多任务学习

Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.

ShotBench：视觉-语言模型中的专家级电影理解

ShotBench：视觉-语言模型中的专家级电影理解

Hongbo Liu, Jingwen He, Yi Jin, et al.

XVerse：通过DiT调制实现一致的多主体身份和语义属性控制

XVerse：通过DiT调制实现一致的多主体身份和语义属性控制

Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.

24孔板中的零样本抗体设计

24孔板中的零样本抗体设计

Chai Discovery Team

KinFormer：适用于催化有机反应动力学的通用动态符号回归

KinFormer：适用于催化有机反应动力学的通用动态符号回归

Jindou Chen, Jidong Tian, Liang Wu, et al.

MiCo：多图像对比强化视觉推理

MiCo：多图像对比强化视觉推理

Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.

细粒度偏好优化改进了VLM中的空间推理能力

细粒度偏好优化改进了VLM中的空间推理能力

Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.

Ark：一个基于Python的开源机器人学习框架

Ark：一个基于Python的开源机器人学习框架

机器人技术

Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.

Pangu Pro MoE：分组专家混合以实现高效的稀疏性

Pangu Pro MoE：分组专家混合以实现高效的稀疏性

Tang, Yehui, Li, et al.

LLaVA-Scissor：基于语义连通分量的视频大语言模型中的令牌压缩

LLaVA-Scissor：基于语义连通分量的视频大语言模型中的令牌压缩

Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.

BlenderFusion：基于3D的视觉编辑与生成合成

BlenderFusion：基于3D的视觉编辑与生成合成

Chen, Jiacheng, Mehran, et al.

UniMate：一种统一的机械超材料生成、性能预测及条件确认模型

UniMate：一种统一的机械超材料生成、性能预测及条件确认模型

多任务学习

Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.

学习跳过Transformer的中间层

学习跳过Transformer的中间层

Tim Lawson, Laurence Aitchison

SAM4D：在相机和激光雷达流中分割任何物体

SAM4D：在相机和激光雷达流中分割任何物体

Jianyun Xu, Song Wang, Ziqian Ni, et al.

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

自然语言处理

Ziyue Li, Chenrui Fan, Tianyi Zhou

FineWeb2：一管通天下——适应每种语言的预训练数据处理

FineWeb2：一管通天下——适应每种语言的预训练数据处理

Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.

MADrive：增强记忆的驾驶场景建模

MADrive：增强记忆的驾驶场景建模

计算机视觉

Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

Advait Gupta, Rishie Raj, Dang Nguyen, et al.

Mind2Web 2：评估代理搜索中的代理作为评判者

Mind2Web 2：评估代理搜索中的代理作为评判者

检索增强生成

Boyu Gou, Zanming Huang, Yuting Ning, et al.

WorldVLA：迈向自回归动作世界模型

WorldVLA：迈向自回归动作世界模型

Jun Cen, Chaohui Yu, Hangjie Yuan, et al.

ReCode：利用强化学习更新代码API知识

ReCode：利用强化学习更新代码API知识

Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.