HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

科学家的首次测试：通过感知、理解和推理探究MLLM的认知能力

科学家的首次测试：通过感知、理解和推理探究MLLM的认知能力

Zhou, Yuhao, Wang, et al.

MiniMax-M1：使用闪电注意力高效扩展测试时计算

MiniMax-M1：使用闪电注意力高效扩展测试时计算

MiniMax, Aili Chen, Aonian Li, et al.

聚苯乙烯纳米塑料通过外泌体递送的微小RNA改变细菌与宿主的相互作用，从而破坏肠道微环境。

聚苯乙烯纳米塑料通过外泌体递送的微小RNA改变细菌与宿主的相互作用，从而破坏肠道微环境。

Wei-Hsuan Hsu, You-Zuo Chen, Yi-Ting Chiang, et al.

超越同质注意力：通过傅里叶近似KV缓存实现内存高效的LLM模型

超越同质注意力：通过傅里叶近似KV缓存实现内存高效的LLM模型

Xiaoran Liu, Siyang He, Qiqi Wang, et al.

高质量数据集和可靠的评估方法用于交错图像-文本生成

高质量数据集和可靠的评估方法用于交错图像-文本生成

Yukang Feng, Jianwen Sun, Chuanhao Li, et al.

SwS：强化学习中用于LLM推理的自我感知弱点驱动问题合成

SwS：强化学习中用于LLM推理的自我感知弱点驱动问题合成

Liang, Xiao, Li, et al.

LiveCodeBench Pro：奥林匹克奖牌得主如何评价大型语言模型在竞争编程中的表现？

LiveCodeBench Pro：奥林匹克奖牌得主如何评价大型语言模型在竞争编程中的表现？

Zihan Zheng, Zerui Cheng, Zeyu Shen, et al.

扩散二象性

扩散二象性

自然语言处理

Sahoo, Subham Sekhar, Deschenaux, et al.

政策遵从代理的有效红队测试

政策遵从代理的有效红队测试

Itay Nakash, George Kour, Koren Lazar, et al.

通过跨模态注意力机制实现对齐的新视角图像和几何合成

通过跨模态注意力机制实现对齐的新视角图像和几何合成

Min-Seop Kwak, Junho Kim, Sangdoo Yun, et al.

电反应的统一可微学习

电反应的统一可微学习

Stefano Falletta, Andrea Cepellotti, Anders Johansson, et al.

VRBench：长叙事视频多步推理的基准测试集

VRBench：长叙事视频多步推理的基准测试集

Yu, Jiashuo, Wu, et al.

AniMaker：基于MCTS驱动的多智能体自动动画故事生成

AniMaker：基于MCTS驱动的多智能体自动动画故事生成

Shi, Haoyuan, Li, et al.

基于文本的图像修复与扩散模型

基于文本的图像修复与扩散模型

Jaewon Min, Jin Hyeon Kim, Paul Hyunbin Cho, et al.

Magistral

Mistral-AI, Abhinav Rastogi, Albert Q. Jiang, et al.

SWE-Factory：您的自动化问题解决训练数据和评估基准工厂

SWE-Factory：您的自动化问题解决训练数据和评估基准工厂

Lianghong Guo, Yanlin Wang, Caihua Li, et al.

ReasonMed：一个由多代理生成的370K数据集，用于推进医学推理

ReasonMed：一个由多代理生成的370K数据集，用于推进医学推理

Yu Sun, Xingyu Qian, Weiwen Xu, et al.

智人：人类视觉模型的基础

智人：人类视觉模型的基础

计算机视觉

多任务学习

Rawal Khirodkar, Timur Bagautdinov, Julieta Martinez, et al.

LongVILA：面向长视频的长上下文视觉语言模型扩展

LongVILA：面向长视频的长上下文视觉语言模型扩展

Fuzhao Xue, Yukang Chen, Dacheng Li, et al.

DeepSeek-Prover-V1.5：利用证明助手反馈进行强化学习与蒙特卡洛树搜索

DeepSeek-Prover-V1.5：利用证明助手反馈进行强化学习与蒙特卡洛树搜索

Huajian Xin, Z. Z. Ren, Junxiao Song, et al.

LLaVA-OneVision：简易视觉任务迁移

LLaVA-OneVision：简易视觉任务迁移

Bo Li, Yuanhan Zhang, Dong Guo, et al.

SAM 2：图像与视频中的任意分割

SAM 2：图像与视频中的任意分割

计算机视觉

Nikhila Ravi, Valentin Gabeur, Yuan-Ting Hu, et al.

Llama 3 模型群

Llama 3 模型群

Abhimanyu Dubey, Abhinav Jauhri, Abhinav Pandey, et al.

InternLM-XComposer-2.5：一个支持长上下文输入与输出的通用大视觉语言模型

InternLM-XComposer-2.5：一个支持长上下文输入与输出的通用大视觉语言模型

统一多模态

多模态表征

Pan Zhang, Xiaoyi Dong, Yuhang Zang, et al.

MMDU：面向LVLMs的多轮多图像对话理解基准与指令微调数据集

MMDU：面向LVLMs的多轮多图像对话理解基准与指令微调数据集

Ziyu Liu, Tao Chu, Yuhang Zang, et al.

构建视觉-语言模型时，什么因素至关重要？

构建视觉-语言模型时，什么因素至关重要？

Hugo Laurençon, Léo Tronchon, Matthieu Cord, et al.

DDOS：无人机深度与障碍物分割数据集

DDOS：无人机深度与障碍物分割数据集

Benedikt Kolbeinsson, Krystian Mikolajczyk

基于深度学习的按需逆向设计具有任意目标带隙的超材料的框架

基于深度学习的按需逆向设计具有任意目标带隙的超材料的框架

卷积神经网络

Than V. Tran, S. S. Nanthakumar, Xiaoying Zhuang

PRefLexOR：基于偏好的递归语言建模用于推理与智能体思维的探索性优化

PRefLexOR：基于偏好的递归语言建模用于推理与智能体思维的探索性优化

Markus J. Buehler

自回归模型与流匹配模型：文本到音乐生成建模范式的比较研究

自回归模型与流匹配模型：文本到音乐生成建模范式的比较研究

Tal, Or, Kreuk, et al.

SeerAttention-R：用于长推理的稀疏注意力适应

SeerAttention-R：用于长推理的稀疏注意力适应

自然语言处理

Gao, Yizhao, Guo, et al.

PlayerOne：以自我为中心的世界模拟器

PlayerOne：以自我为中心的世界模拟器

Yuanpeng Tu, Hao Luo, Xi Chen, et al.

科学家的首次测试：通过感知、理解和推理探究MLLM的认知能力

科学家的首次测试：通过感知、理解和推理探究MLLM的认知能力

Zhou, Yuhao, Wang, et al.

MiniMax-M1：使用闪电注意力高效扩展测试时计算

MiniMax-M1：使用闪电注意力高效扩展测试时计算

MiniMax, Aili Chen, Aonian Li, et al.

聚苯乙烯纳米塑料通过外泌体递送的微小RNA改变细菌与宿主的相互作用，从而破坏肠道微环境。

聚苯乙烯纳米塑料通过外泌体递送的微小RNA改变细菌与宿主的相互作用，从而破坏肠道微环境。

Wei-Hsuan Hsu, You-Zuo Chen, Yi-Ting Chiang, et al.

超越同质注意力：通过傅里叶近似KV缓存实现内存高效的LLM模型

超越同质注意力：通过傅里叶近似KV缓存实现内存高效的LLM模型

Xiaoran Liu, Siyang He, Qiqi Wang, et al.

高质量数据集和可靠的评估方法用于交错图像-文本生成

高质量数据集和可靠的评估方法用于交错图像-文本生成

Yukang Feng, Jianwen Sun, Chuanhao Li, et al.

SwS：强化学习中用于LLM推理的自我感知弱点驱动问题合成

SwS：强化学习中用于LLM推理的自我感知弱点驱动问题合成

Liang, Xiao, Li, et al.

LiveCodeBench Pro：奥林匹克奖牌得主如何评价大型语言模型在竞争编程中的表现？

LiveCodeBench Pro：奥林匹克奖牌得主如何评价大型语言模型在竞争编程中的表现？

Zihan Zheng, Zerui Cheng, Zeyu Shen, et al.

扩散二象性

扩散二象性

自然语言处理

Sahoo, Subham Sekhar, Deschenaux, et al.

政策遵从代理的有效红队测试

政策遵从代理的有效红队测试

Itay Nakash, George Kour, Koren Lazar, et al.

通过跨模态注意力机制实现对齐的新视角图像和几何合成

通过跨模态注意力机制实现对齐的新视角图像和几何合成

Min-Seop Kwak, Junho Kim, Sangdoo Yun, et al.

电反应的统一可微学习

电反应的统一可微学习

Stefano Falletta, Andrea Cepellotti, Anders Johansson, et al.

VRBench：长叙事视频多步推理的基准测试集

VRBench：长叙事视频多步推理的基准测试集

Yu, Jiashuo, Wu, et al.

AniMaker：基于MCTS驱动的多智能体自动动画故事生成

AniMaker：基于MCTS驱动的多智能体自动动画故事生成

Shi, Haoyuan, Li, et al.

基于文本的图像修复与扩散模型

基于文本的图像修复与扩散模型

Jaewon Min, Jin Hyeon Kim, Paul Hyunbin Cho, et al.

Magistral

Mistral-AI, Abhinav Rastogi, Albert Q. Jiang, et al.

SWE-Factory：您的自动化问题解决训练数据和评估基准工厂

SWE-Factory：您的自动化问题解决训练数据和评估基准工厂

Lianghong Guo, Yanlin Wang, Caihua Li, et al.

ReasonMed：一个由多代理生成的370K数据集，用于推进医学推理

ReasonMed：一个由多代理生成的370K数据集，用于推进医学推理

Yu Sun, Xingyu Qian, Weiwen Xu, et al.

智人：人类视觉模型的基础

智人：人类视觉模型的基础

计算机视觉

多任务学习

Rawal Khirodkar, Timur Bagautdinov, Julieta Martinez, et al.

LongVILA：面向长视频的长上下文视觉语言模型扩展

LongVILA：面向长视频的长上下文视觉语言模型扩展

Fuzhao Xue, Yukang Chen, Dacheng Li, et al.

DeepSeek-Prover-V1.5：利用证明助手反馈进行强化学习与蒙特卡洛树搜索

DeepSeek-Prover-V1.5：利用证明助手反馈进行强化学习与蒙特卡洛树搜索

Huajian Xin, Z. Z. Ren, Junxiao Song, et al.

LLaVA-OneVision：简易视觉任务迁移

LLaVA-OneVision：简易视觉任务迁移

Bo Li, Yuanhan Zhang, Dong Guo, et al.

SAM 2：图像与视频中的任意分割

SAM 2：图像与视频中的任意分割

计算机视觉

Nikhila Ravi, Valentin Gabeur, Yuan-Ting Hu, et al.

Llama 3 模型群

Llama 3 模型群

Abhimanyu Dubey, Abhinav Jauhri, Abhinav Pandey, et al.

InternLM-XComposer-2.5：一个支持长上下文输入与输出的通用大视觉语言模型

InternLM-XComposer-2.5：一个支持长上下文输入与输出的通用大视觉语言模型

统一多模态

多模态表征

Pan Zhang, Xiaoyi Dong, Yuhang Zang, et al.

MMDU：面向LVLMs的多轮多图像对话理解基准与指令微调数据集

MMDU：面向LVLMs的多轮多图像对话理解基准与指令微调数据集

Ziyu Liu, Tao Chu, Yuhang Zang, et al.

构建视觉-语言模型时，什么因素至关重要？

构建视觉-语言模型时，什么因素至关重要？

Hugo Laurençon, Léo Tronchon, Matthieu Cord, et al.

DDOS：无人机深度与障碍物分割数据集

DDOS：无人机深度与障碍物分割数据集

Benedikt Kolbeinsson, Krystian Mikolajczyk

基于深度学习的按需逆向设计具有任意目标带隙的超材料的框架

基于深度学习的按需逆向设计具有任意目标带隙的超材料的框架

卷积神经网络

Than V. Tran, S. S. Nanthakumar, Xiaoying Zhuang

PRefLexOR：基于偏好的递归语言建模用于推理与智能体思维的探索性优化

PRefLexOR：基于偏好的递归语言建模用于推理与智能体思维的探索性优化

Markus J. Buehler

自回归模型与流匹配模型：文本到音乐生成建模范式的比较研究

自回归模型与流匹配模型：文本到音乐生成建模范式的比较研究

Tal, Or, Kreuk, et al.

SeerAttention-R：用于长推理的稀疏注意力适应

SeerAttention-R：用于长推理的稀疏注意力适应

自然语言处理

Gao, Yizhao, Guo, et al.

PlayerOne：以自我为中心的世界模拟器

PlayerOne：以自我为中心的世界模拟器

Yuanpeng Tu, Hao Luo, Xi Chen, et al.