HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

RelayLLM：通过协作解码实现高效推理

RelayLLM：通过协作解码实现高效推理

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

基于FusionRoute的Token级LLM协作

基于FusionRoute的Token级LLM协作

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

可学习的缩放因子：释放语言模型矩阵层的规模限制

可学习的缩放因子：释放语言模型矩阵层的规模限制

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

从失败到精通：为Tool-use Agents生成困难样本

从失败到精通：为Tool-use Agents生成困难样本

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

编排一个动态物体的世界

编排一个动态物体的世界

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：统一的多任务音视频联合生成

Klear：统一的多任务音视频联合生成

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：面向多领域复杂推理的异构模型与工具编排

Atlas：面向多领域复杂推理的异构模型与工具编排

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLM基准测试的系统性评估

Benchmark^2：LLM基准测试的系统性评估

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：迈向更智能的多模态工具融合推理

MindWatcher：迈向更智能的多模态工具融合推理

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

熵自适应微调：通过解决自信冲突以缓解遗忘

熵自适应微调：通过解决自信冲突以缓解遗忘

监督式微调

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多样性还是精确性？深入探究下一个token预测

多样性还是精确性？深入探究下一个token预测

监督式微调

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.

孔子代码Agent：面向真实代码库的可扩展Agent框架

孔子代码Agent：面向真实代码库的可扩展Agent框架

Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.

DreamStyle：一种统一的视频风格化框架

DreamStyle：一种统一的视频风格化框架

Mengtian Li, Jinshu Chen, Songtao Zhao, et al.

UniCorn：通过自生成监督实现自我提升的统一多模态模型

UniCorn：通过自生成监督实现自我提升的统一多模态模型

Ruiyan Han, Zhen Fang, XinYu Sun, et al.

LTX-2：高效联合音视频基础模型

LTX-2：高效联合音视频基础模型

Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.

SciEvalKit：面向科学通用智能的开源评估工具包

SciEvalKit：面向科学通用智能的开源评估工具包

Yiheng Wang, Yixin Chen, Shuo Li, et al.

MOSS 语音转写与说话人分离：支持说话人分离的精准语音转写

MOSS 语音转写与说话人分离：支持说话人分离的精准语音转写

音频和语音处理

Donghua Yu, Zhengyuan Lin, Chen Yang, et al.

InfiniDepth：基于神经隐式场的任意分辨率与细粒度深度估计

InfiniDepth：基于神经隐式场的任意分辨率与细粒度深度估计

机器视觉 3D

Hao Yu, Haotong Lin, Jiawei Wang, et al.

代理型AI的适应性调整

代理型AI的适应性调整

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.

大型视频规划器实现可泛化的机器人控制

大型视频规划器实现可泛化的机器人控制

机器人技术

Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.

InfiniteVGGT：面向无限数据流的视觉几何基底Transformer

InfiniteVGGT：面向无限数据流的视觉几何基底Transformer

机器视觉 3D

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO：防止奖励劫持的扩散模型强化方法

GARDO：防止奖励劫持的扩散模型强化方法

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RL 正确实现：应对视觉自回归生成中的异步策略冲突

VAR RL 正确实现：应对视觉自回归生成中的异步策略冲突

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V：通过扩散Transformer弥合图像到视频的鸿沟实现高保真人脸替换

DreamID-V：通过扩散Transformer弥合图像到视频的鸿沟实现高保真人脸替换

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow：统一的序列建模激活多模态理解与生成

NextFlow：统一的序列建模激活多模态理解与生成

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE 技术报告

K-EXAONE 技术报告

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

Hunger Game Debate：多智能体系统中过度竞争的涌现

Hunger Game Debate：多智能体系统中过度竞争的涌现

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

使用评分标准奖励训练AI协作者科学家

使用评分标准奖励训练AI协作者科学家

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

RelayLLM：通过协作解码实现高效推理

RelayLLM：通过协作解码实现高效推理

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

基于FusionRoute的Token级LLM协作

基于FusionRoute的Token级LLM协作

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

可学习的缩放因子：释放语言模型矩阵层的规模限制

可学习的缩放因子：释放语言模型矩阵层的规模限制

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

从失败到精通：为Tool-use Agents生成困难样本

从失败到精通：为Tool-use Agents生成困难样本

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

编排一个动态物体的世界

编排一个动态物体的世界

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：统一的多任务音视频联合生成

Klear：统一的多任务音视频联合生成

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：面向多领域复杂推理的异构模型与工具编排

Atlas：面向多领域复杂推理的异构模型与工具编排

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLM基准测试的系统性评估

Benchmark^2：LLM基准测试的系统性评估

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：迈向更智能的多模态工具融合推理

MindWatcher：迈向更智能的多模态工具融合推理

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

熵自适应微调：通过解决自信冲突以缓解遗忘

熵自适应微调：通过解决自信冲突以缓解遗忘

监督式微调

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多样性还是精确性？深入探究下一个token预测

多样性还是精确性？深入探究下一个token预测

监督式微调

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.

孔子代码Agent：面向真实代码库的可扩展Agent框架

孔子代码Agent：面向真实代码库的可扩展Agent框架

Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.

DreamStyle：一种统一的视频风格化框架

DreamStyle：一种统一的视频风格化框架

Mengtian Li, Jinshu Chen, Songtao Zhao, et al.

UniCorn：通过自生成监督实现自我提升的统一多模态模型

UniCorn：通过自生成监督实现自我提升的统一多模态模型

Ruiyan Han, Zhen Fang, XinYu Sun, et al.

LTX-2：高效联合音视频基础模型

LTX-2：高效联合音视频基础模型

Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.

SciEvalKit：面向科学通用智能的开源评估工具包

SciEvalKit：面向科学通用智能的开源评估工具包

Yiheng Wang, Yixin Chen, Shuo Li, et al.

MOSS 语音转写与说话人分离：支持说话人分离的精准语音转写

MOSS 语音转写与说话人分离：支持说话人分离的精准语音转写

音频和语音处理

Donghua Yu, Zhengyuan Lin, Chen Yang, et al.

InfiniDepth：基于神经隐式场的任意分辨率与细粒度深度估计

InfiniDepth：基于神经隐式场的任意分辨率与细粒度深度估计

机器视觉 3D

Hao Yu, Haotong Lin, Jiawei Wang, et al.

代理型AI的适应性调整

代理型AI的适应性调整

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.

大型视频规划器实现可泛化的机器人控制

大型视频规划器实现可泛化的机器人控制

机器人技术

Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.

InfiniteVGGT：面向无限数据流的视觉几何基底Transformer

InfiniteVGGT：面向无限数据流的视觉几何基底Transformer

机器视觉 3D

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO：防止奖励劫持的扩散模型强化方法

GARDO：防止奖励劫持的扩散模型强化方法

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RL 正确实现：应对视觉自回归生成中的异步策略冲突

VAR RL 正确实现：应对视觉自回归生成中的异步策略冲突

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V：通过扩散Transformer弥合图像到视频的鸿沟实现高保真人脸替换

DreamID-V：通过扩散Transformer弥合图像到视频的鸿沟实现高保真人脸替换

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow：统一的序列建模激活多模态理解与生成

NextFlow：统一的序列建模激活多模态理解与生成

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE 技术报告

K-EXAONE 技术报告

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

Hunger Game Debate：多智能体系统中过度竞争的涌现

Hunger Game Debate：多智能体系统中过度竞争的涌现

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

使用评分标准奖励训练AI协作者科学家

使用评分标准奖励训练AI协作者科学家

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.