HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

RPG：用于统一且可扩展代码库生成的仓库规划图

RPG：用于统一且可扩展代码库生成的仓库规划图

Jane Luo, Xin Zhang, Steven Liu, et al.

合成自举预训练

合成自举预训练

Zitong Yang, Aonan Zhang, Hong Liu, et al.

基于再分析数据训练的机器学习天气模型实现精准的全球季节预测

基于再分析数据训练的机器学习天气模型实现精准的全球季节预测

Chris Kent, Adam A. Scaife, Nick J. Dunstone, et al.

FinSearchComp：迈向现实的、专家级别的金融搜索与推理评估

FinSearchComp：迈向现实的、专家级别的金融搜索与推理评估

Liang Hu, Jianpeng Jiao, Jiashuo Liu, et al.

生成之前先理解：自引导训练用于自回归图像生成

生成之前先理解：自引导训练用于自回归图像生成

Xiaoyu Yue, Zidong Wang, Yuqing Wang, et al.

无标签的演化语言模型：多数驱动选择，新颖促进变异

无标签的演化语言模型：多数驱动选择，新颖促进变异

Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.

边界推理：通过推理时反思提升规范对齐

边界推理：通过推理时反思提升规范对齐

Haoran Zhang, Yafu Li, Xuyang Hu, et al.

FlowRL：为LLM推理匹配奖励分布

FlowRL：为LLM推理匹配奖励分布

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.

大型预训练视觉语言模型能否有效担任施工安全检查员？

大型预训练视觉语言模型能否有效担任施工安全检查员？

Xuezheng Chen, Zhengbo Zou

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.

不稳定性奇点的发现

不稳定性奇点的发现

Yongji Wang, Mehdi Bennani, James Martens, et al.

VCBench：在风险投资中对LLMs进行基准测试

VCBench：在风险投资中对LLMs进行基准测试

Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

检索增强生成

Ailing Yu, Lan Yao, Jingnan Liu, et al.

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

全景图：具身AI时代全向视觉的崛起

计算机视觉

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

Daya Guo, Dejian Yang, Haowei Zhang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

检索增强生成

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

检索增强生成

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

RPG：用于统一且可扩展代码库生成的仓库规划图

RPG：用于统一且可扩展代码库生成的仓库规划图

Jane Luo, Xin Zhang, Steven Liu, et al.

合成自举预训练

合成自举预训练

Zitong Yang, Aonan Zhang, Hong Liu, et al.

基于再分析数据训练的机器学习天气模型实现精准的全球季节预测

基于再分析数据训练的机器学习天气模型实现精准的全球季节预测

Chris Kent, Adam A. Scaife, Nick J. Dunstone, et al.

FinSearchComp：迈向现实的、专家级别的金融搜索与推理评估

FinSearchComp：迈向现实的、专家级别的金融搜索与推理评估

Liang Hu, Jianpeng Jiao, Jiashuo Liu, et al.

生成之前先理解：自引导训练用于自回归图像生成

生成之前先理解：自引导训练用于自回归图像生成

Xiaoyu Yue, Zidong Wang, Yuqing Wang, et al.

无标签的演化语言模型：多数驱动选择，新颖促进变异

无标签的演化语言模型：多数驱动选择，新颖促进变异

Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.

边界推理：通过推理时反思提升规范对齐

边界推理：通过推理时反思提升规范对齐

Haoran Zhang, Yafu Li, Xuyang Hu, et al.

FlowRL：为LLM推理匹配奖励分布

FlowRL：为LLM推理匹配奖励分布

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.

大型预训练视觉语言模型能否有效担任施工安全检查员？

大型预训练视觉语言模型能否有效担任施工安全检查员？

Xuezheng Chen, Zhengbo Zou

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.

不稳定性奇点的发现

不稳定性奇点的发现

Yongji Wang, Mehdi Bennani, James Martens, et al.

VCBench：在风险投资中对LLMs进行基准测试

VCBench：在风险投资中对LLMs进行基准测试

Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

检索增强生成

Ailing Yu, Lan Yao, Jingnan Liu, et al.

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

全景图：具身AI时代全向视觉的崛起

计算机视觉

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

Daya Guo, Dejian Yang, Haowei Zhang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

检索增强生成

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

检索增强生成

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.