HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

DesignLab：通过迭代检测与修正设计幻灯片

DesignLab：通过迭代检测与修正设计幻灯片

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

Yume：一个交互式世界生成模型

Yume：一个交互式世界生成模型

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

像素、模式，但无诗意：像人类一样看世界

像素、模式，但无诗意：像人类一样看世界

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

Xinyao Liu, Diping Song

HySafe-AI：AI系统混合安全架构分析框架：案例研究

HySafe-AI：AI系统混合安全架构分析框架：案例研究

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

斑马-CoT：一种交叉视觉语言推理数据集

斑马-CoT：一种交叉视觉语言推理数据集

Ang Li, Charles Wang, Kaiyu Yue, et al.

基于视觉-语言慢思考的半离策略强化学习

基于视觉-语言慢思考的半离策略强化学习

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

《MegaScience：推动科学推理的训练后数据集前沿》

《MegaScience：推动科学推理的训练后数据集前沿》

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

Step-Audio 2 技术报告

Step-Audio 2 技术报告

Boyong Wu, Chao Yan, Chen Hu, et al.

超越上下文限制：用于长时程推理的潜意识线索

超越上下文限制：用于长时程推理的潜意识线索

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

前沿人工智能风险管理框架实践：风险分析技术报告

前沿人工智能风险管理框架实践：风险分析技术报告

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

无需人类参与：自主高质量图像编辑三元组挖掘

无需人类参与：自主高质量图像编辑三元组挖掘

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

Hayeon Kim, Ji Ha Jang, Se Young Chun

WebShaper：通过信息寻求进行数据合成的Agent化形式化

WebShaper：通过信息寻求进行数据合成的Agent化形式化

检索增强生成

Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.

无形的牵引：为何RLVR可能无法摆脱其起源

无形的牵引：为何RLVR可能无法摆脱其起源

Fang Wu, Weihao Xuan, Ximing Lu, et al.

GUI-G^2：用于 GUI 定位的高斯奖励建模

GUI-G^2：用于 GUI 定位的高斯奖励建模

Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.

MiroMind-M1：通过上下文感知多阶段策略优化在数学推理领域的开源进展

MiroMind-M1：通过上下文感知多阶段策略优化在数学推理领域的开源进展

监督式微调

统一多模态

Xingxuan Li, Yao Xiao, Dianwen Ng, et al.

内在无序区域结合蛋白的设计

内在无序区域结合蛋白的设计

Kejia Wu, et al

全原子生成模型用于设计蛋白质复合物

全原子生成模型用于设计蛋白质复合物

Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.

RedOne：揭示社交网络服务中的领域特定LLM后训练

RedOne：揭示社交网络服务中的领域特定LLM后训练

监督式微调

Fei Zhao, Chonggang Lu, Yue Wang, et al.

CSD-VAR：视觉自回归模型中的内容-风格分解

CSD-VAR：视觉自回归模型中的内容-风格分解

Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.

Mono-InternVL-1.5：迈向更经济、更快捷的单片多模态大语言模型

Mono-InternVL-1.5：迈向更经济、更快捷的单片多模态大语言模型

Gen Luo, Wenhan Dou, Wenhao Li, et al.

弗兰卡：嵌套马特里欧什卡聚类用于可扩展的视觉表示学习

弗兰卡：嵌套马特里欧什卡聚类用于可扩展的视觉表示学习

计算机视觉

Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.

一种以数据为中心的框架，用于解决俄语语音生成模型中的音位和韵律挑战

一种以数据为中心的框架，用于解决俄语语音生成模型中的音位和韵律挑战

统一多模态

Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, et al.

戴上面具的恶魔：扩散型LLM的安全漏洞问题

戴上面具的恶魔：扩散型LLM的安全漏洞问题

监督式微调

Zichen Wen, Jiashu Qu, Dongrui Liu, et al.

PrefPalette：基于潜在属性的个性化偏好建模

PrefPalette：基于潜在属性的个性化偏好建模

自然语言处理

Shuyue Stella Li, Melanie Sclar, Hunter Lang, et al.

CUDA-L1：通过对比强化学习提升CUDA优化

CUDA-L1：通过对比强化学习提升CUDA优化

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

AnyCap 项目：可控全模态标题生成的统一框架、数据集和基准测试

AnyCap 项目：可控全模态标题生成的统一框架、数据集和基准测试

统一多模态

Yiming Ren, Zhiqiang Lin, Yu Li, et al.

Diffuman4D：基于稀疏视角视频和时空扩散模型的4D一致人体视图合成

Diffuman4D：基于稀疏视角视频和时空扩散模型的4D一致人体视图合成

Yudong Jin, Sida Peng, Xuan Wang, et al.

《模仿游戏：图灵机模仿者是长度泛化的推理者》

《模仿游戏：图灵机模仿者是长度泛化的推理者》

Zhouqi Hua, Wenwei Zhang, Chengqi Lyu, et al.

DesignLab：通过迭代检测与修正设计幻灯片

DesignLab：通过迭代检测与修正设计幻灯片

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

Yume：一个交互式世界生成模型

Yume：一个交互式世界生成模型

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

像素、模式，但无诗意：像人类一样看世界

像素、模式，但无诗意：像人类一样看世界

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

Xinyao Liu, Diping Song

HySafe-AI：AI系统混合安全架构分析框架：案例研究

HySafe-AI：AI系统混合安全架构分析框架：案例研究

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

斑马-CoT：一种交叉视觉语言推理数据集

斑马-CoT：一种交叉视觉语言推理数据集

Ang Li, Charles Wang, Kaiyu Yue, et al.

基于视觉-语言慢思考的半离策略强化学习

基于视觉-语言慢思考的半离策略强化学习

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

《MegaScience：推动科学推理的训练后数据集前沿》

《MegaScience：推动科学推理的训练后数据集前沿》

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

Step-Audio 2 技术报告

Step-Audio 2 技术报告

Boyong Wu, Chao Yan, Chen Hu, et al.

超越上下文限制：用于长时程推理的潜意识线索

超越上下文限制：用于长时程推理的潜意识线索

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

前沿人工智能风险管理框架实践：风险分析技术报告

前沿人工智能风险管理框架实践：风险分析技术报告

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

无需人类参与：自主高质量图像编辑三元组挖掘

无需人类参与：自主高质量图像编辑三元组挖掘

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

Hayeon Kim, Ji Ha Jang, Se Young Chun

WebShaper：通过信息寻求进行数据合成的Agent化形式化

WebShaper：通过信息寻求进行数据合成的Agent化形式化

检索增强生成

Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.

无形的牵引：为何RLVR可能无法摆脱其起源

无形的牵引：为何RLVR可能无法摆脱其起源

Fang Wu, Weihao Xuan, Ximing Lu, et al.

GUI-G^2：用于 GUI 定位的高斯奖励建模

GUI-G^2：用于 GUI 定位的高斯奖励建模

Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.

MiroMind-M1：通过上下文感知多阶段策略优化在数学推理领域的开源进展

MiroMind-M1：通过上下文感知多阶段策略优化在数学推理领域的开源进展

监督式微调

统一多模态

Xingxuan Li, Yao Xiao, Dianwen Ng, et al.

内在无序区域结合蛋白的设计

内在无序区域结合蛋白的设计

Kejia Wu, et al

全原子生成模型用于设计蛋白质复合物

全原子生成模型用于设计蛋白质复合物

Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.

RedOne：揭示社交网络服务中的领域特定LLM后训练

RedOne：揭示社交网络服务中的领域特定LLM后训练

监督式微调

Fei Zhao, Chonggang Lu, Yue Wang, et al.

CSD-VAR：视觉自回归模型中的内容-风格分解

CSD-VAR：视觉自回归模型中的内容-风格分解

Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.

Mono-InternVL-1.5：迈向更经济、更快捷的单片多模态大语言模型

Mono-InternVL-1.5：迈向更经济、更快捷的单片多模态大语言模型

Gen Luo, Wenhan Dou, Wenhao Li, et al.

弗兰卡：嵌套马特里欧什卡聚类用于可扩展的视觉表示学习

弗兰卡：嵌套马特里欧什卡聚类用于可扩展的视觉表示学习

计算机视觉

Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.

一种以数据为中心的框架，用于解决俄语语音生成模型中的音位和韵律挑战

一种以数据为中心的框架，用于解决俄语语音生成模型中的音位和韵律挑战

统一多模态

Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, et al.

戴上面具的恶魔：扩散型LLM的安全漏洞问题

戴上面具的恶魔：扩散型LLM的安全漏洞问题

监督式微调

Zichen Wen, Jiashu Qu, Dongrui Liu, et al.

PrefPalette：基于潜在属性的个性化偏好建模

PrefPalette：基于潜在属性的个性化偏好建模

自然语言处理

Shuyue Stella Li, Melanie Sclar, Hunter Lang, et al.

CUDA-L1：通过对比强化学习提升CUDA优化

CUDA-L1：通过对比强化学习提升CUDA优化

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

AnyCap 项目：可控全模态标题生成的统一框架、数据集和基准测试

AnyCap 项目：可控全模态标题生成的统一框架、数据集和基准测试

统一多模态

Yiming Ren, Zhiqiang Lin, Yu Li, et al.

Diffuman4D：基于稀疏视角视频和时空扩散模型的4D一致人体视图合成

Diffuman4D：基于稀疏视角视频和时空扩散模型的4D一致人体视图合成

Yudong Jin, Sida Peng, Xuan Wang, et al.

《模仿游戏：图灵机模仿者是长度泛化的推理者》

《模仿游戏：图灵机模仿者是长度泛化的推理者》

Zhouqi Hua, Wenwei Zhang, Chengqi Lyu, et al.