HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

从何到因：一种基于证据的化学反应条件推理多Agent系统

从何到因：一种基于证据的化学反应条件推理多Agent系统

检索增强生成

Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.

DreamOmni2：基于多模态指令的编辑与生成

DreamOmni2：基于多模态指令的编辑与生成

Bin Xia, Bohao Peng, Yuechen Zhang, et al.

VideoCanvas：通过上下文条件实现任意时空补丁的统一视频补全

VideoCanvas：通过上下文条件实现任意时空补丁的统一视频补全

Minghong Cai, Qiulin Wang, Zongli Ye, et al.

UniVideo：视频的统一理解、生成与编辑

UniVideo：视频的统一理解、生成与编辑

统一多模态

Cong Wei, Quande Liu, Zixuan Ye, et al.

MemMamba：重新思考状态空间模型中的记忆模式

MemMamba：重新思考状态空间模型中的记忆模式

自然语言处理

Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.

MM-HELIX：通过整体平台与自适应混合策略优化提升多模态长链反思推理

MM-HELIX：通过整体平台与自适应混合策略优化提升多模态长链反思推理

Xiangyu Zhao, Junming Lin, Tianhao Liang, et al.

PromptCoT 2.0：面向大型语言模型推理的提示合成扩展

PromptCoT 2.0：面向大型语言模型推理的提示合成扩展

Xueliang Zhao, Wei Wu, Jian Guan, et al.

Extract-0：用于文档信息提取的专用语言模型

Extract-0：用于文档信息提取的专用语言模型

监督式微调

OmniRetarget：面向人形机器人全身运动与操作及场景交互的交互保持型数据生成

OmniRetarget：面向人形机器人全身运动与操作及场景交互的交互保持型数据生成

机器人技术

Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.

WildSpeech-Bench：在真实场景中对端到端SpeechLLM进行基准测试

WildSpeech-Bench：在真实场景中对端到端SpeechLLM进行基准测试

音频和语音处理

Linhao Zhang, Jian Zhang, Bokai Lei, et al.

针对大型语言模型对齐的内部激活值的Token感知编辑

针对大型语言模型对齐的内部激活值的Token感知编辑

监督式微调

Tianbo Wang, Yuqing Ma, Kewei Liao, et al.

旨在学习：面向低资源视觉-语言建模的Token级动态门控

旨在学习：面向低资源视觉-语言建模的Token级动态门控

Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.

通过早期经验进行Agent学习

通过早期经验进行Agent学习

监督式微调

Kai Zhang, Xiangchao Chen, Bo Liu, et al.

MATRIX：用于交互感知视频生成的掩码轨迹对齐

MATRIX：用于交互感知视频生成的掩码轨迹对齐

Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.

RLinf-VLA：一种统一且高效的VLA+RL训练框架

RLinf-VLA：一种统一且高效的VLA+RL训练框架

多模态表征

Hongzhi Zang, Mingjie Wei, Si Xu, et al.

SHANKS：用于语音语言模型的同步听与思

SHANKS：用于语音语言模型的同步听与思

音频和语音处理

Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.

Lumina-DiMOO：一种用于多模态生成与理解的全模态扩散大型语言模型

Lumina-DiMOO：一种用于多模态生成与理解的全模态扩散大型语言模型

统一多模态

Yi Xin, Qi Qin, Siqi Luo, et al.

缓存到缓存：大型语言模型之间的直接语义通信

缓存到缓存：大型语言模型之间的直接语义通信

Tianyu Fu, Zihan Min, Hanling Zhang, et al.

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Qwen2.5 技术报告

Qwen2.5 技术报告

监督式微调

Qwen, An Yang, Baosong Yang, et al.

通过引入深度研究增强AlphaEvolve实现科学算法发现

通过引入深度研究增强AlphaEvolve实现科学算法发现

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM：一种面向工业级约束编程的神经符号框架

ConstraintLLM：一种面向工业级约束编程的神经符号框架

监督式微调

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

代码辅助思维链与指令的扩展用于模型推理

代码辅助思维链与指令的扩展用于模型推理

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA：通过扩散适应进行编码LM

CoDA：通过扩散适应进行编码LM

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2：高效块扩散LLM

Fast-dLLM v2：高效块扩散LLM

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

少即是多：使用小型网络进行递归推理

少即是多：使用小型网络进行递归推理

Alexia Jolicoeur-Martineau

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

监督式微调

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

语言模型的混合架构：系统性分析与设计洞察

语言模型的混合架构：系统性分析与设计洞察

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS：通过点互信息增强LLM的树搜索推理

MITS：通过点互信息增强LLM的树搜索推理

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

对大型语言模型的不可察觉的越狱攻击

对大型语言模型的不可察觉的越狱攻击

Kuofeng Gao, Yiming Li, Chao Du, et al.

从何到因：一种基于证据的化学反应条件推理多Agent系统

从何到因：一种基于证据的化学反应条件推理多Agent系统

检索增强生成

Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.

DreamOmni2：基于多模态指令的编辑与生成

DreamOmni2：基于多模态指令的编辑与生成

Bin Xia, Bohao Peng, Yuechen Zhang, et al.

VideoCanvas：通过上下文条件实现任意时空补丁的统一视频补全

VideoCanvas：通过上下文条件实现任意时空补丁的统一视频补全

Minghong Cai, Qiulin Wang, Zongli Ye, et al.

UniVideo：视频的统一理解、生成与编辑

UniVideo：视频的统一理解、生成与编辑

统一多模态

Cong Wei, Quande Liu, Zixuan Ye, et al.

MemMamba：重新思考状态空间模型中的记忆模式

MemMamba：重新思考状态空间模型中的记忆模式

自然语言处理

Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.

MM-HELIX：通过整体平台与自适应混合策略优化提升多模态长链反思推理

MM-HELIX：通过整体平台与自适应混合策略优化提升多模态长链反思推理

Xiangyu Zhao, Junming Lin, Tianhao Liang, et al.

PromptCoT 2.0：面向大型语言模型推理的提示合成扩展

PromptCoT 2.0：面向大型语言模型推理的提示合成扩展

Xueliang Zhao, Wei Wu, Jian Guan, et al.

Extract-0：用于文档信息提取的专用语言模型

Extract-0：用于文档信息提取的专用语言模型

监督式微调

OmniRetarget：面向人形机器人全身运动与操作及场景交互的交互保持型数据生成

OmniRetarget：面向人形机器人全身运动与操作及场景交互的交互保持型数据生成

机器人技术

Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.

WildSpeech-Bench：在真实场景中对端到端SpeechLLM进行基准测试

WildSpeech-Bench：在真实场景中对端到端SpeechLLM进行基准测试

音频和语音处理

Linhao Zhang, Jian Zhang, Bokai Lei, et al.

针对大型语言模型对齐的内部激活值的Token感知编辑

针对大型语言模型对齐的内部激活值的Token感知编辑

监督式微调

Tianbo Wang, Yuqing Ma, Kewei Liao, et al.

旨在学习：面向低资源视觉-语言建模的Token级动态门控

旨在学习：面向低资源视觉-语言建模的Token级动态门控

Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.

通过早期经验进行Agent学习

通过早期经验进行Agent学习

监督式微调

Kai Zhang, Xiangchao Chen, Bo Liu, et al.

MATRIX：用于交互感知视频生成的掩码轨迹对齐

MATRIX：用于交互感知视频生成的掩码轨迹对齐

Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.

RLinf-VLA：一种统一且高效的VLA+RL训练框架

RLinf-VLA：一种统一且高效的VLA+RL训练框架

多模态表征

Hongzhi Zang, Mingjie Wei, Si Xu, et al.

SHANKS：用于语音语言模型的同步听与思

SHANKS：用于语音语言模型的同步听与思

音频和语音处理

Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.

Lumina-DiMOO：一种用于多模态生成与理解的全模态扩散大型语言模型

Lumina-DiMOO：一种用于多模态生成与理解的全模态扩散大型语言模型

统一多模态

Yi Xin, Qi Qin, Siqi Luo, et al.

缓存到缓存：大型语言模型之间的直接语义通信

缓存到缓存：大型语言模型之间的直接语义通信

Tianyu Fu, Zihan Min, Hanling Zhang, et al.

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Qwen2.5 技术报告

Qwen2.5 技术报告

监督式微调

Qwen, An Yang, Baosong Yang, et al.

通过引入深度研究增强AlphaEvolve实现科学算法发现

通过引入深度研究增强AlphaEvolve实现科学算法发现

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM：一种面向工业级约束编程的神经符号框架

ConstraintLLM：一种面向工业级约束编程的神经符号框架

监督式微调

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

代码辅助思维链与指令的扩展用于模型推理

代码辅助思维链与指令的扩展用于模型推理

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA：通过扩散适应进行编码LM

CoDA：通过扩散适应进行编码LM

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2：高效块扩散LLM

Fast-dLLM v2：高效块扩散LLM

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

少即是多：使用小型网络进行递归推理

少即是多：使用小型网络进行递归推理

Alexia Jolicoeur-Martineau

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

监督式微调

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

语言模型的混合架构：系统性分析与设计洞察

语言模型的混合架构：系统性分析与设计洞察

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS：通过点互信息增强LLM的树搜索推理

MITS：通过点互信息增强LLM的树搜索推理

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

对大型语言模型的不可察觉的越狱攻击

对大型语言模型的不可察觉的越狱攻击

Kuofeng Gao, Yiming Li, Chao Du, et al.