HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
RPG:用于统一且可扩展代码库生成的仓库规划图
代码生成
LLM
Jane Luo, Xin Zhang, Steven Liu, et al.
合成自举预训练
LLM
合成
Zitong Yang, Aonan Zhang, Hong Liu, et al.
基于再分析数据训练的机器学习天气模型实现精准的全球季节预测
AI for Science
深度学习
Chris Kent, Adam A. Scaife, Nick J. Dunstone, et al.
FinSearchComp:迈向现实的、专家级别的金融搜索与推理评估
基准
Agent
Liang Hu, Jianpeng Jiao, Jiashuo Liu, et al.
生成之前先理解:自引导训练用于自回归图像生成
图像生成
图像理解
Xiaoyu Yue, Zidong Wang, Yuqing Wang, et al.
无标签的演化语言模型:多数驱动选择,新颖促进变异
强化学习
推理
Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.
边界推理:通过推理时反思提升规范对齐
LLM
推理
Haoran Zhang, Yafu Li, Xuyang Hu, et al.
FlowRL:为LLM推理匹配奖励分布
强化学习
LLM
Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.
ScaleCUA:基于跨平台数据的开源计算机使用Agent扩展
Agent
数据集
Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.
大型预训练视觉语言模型能否有效担任施工安全检查员?
视觉问答
图像描述
Xuezheng Chen, Zhengbo Zou
HTSC-2025:面向AI驱动临界温度预测的常压高温超导体基准数据集
数据集
基准
Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.
不稳定性奇点的发现
AI for Science
深度学习
Yongji Wang, Mehdi Bennani, James Martens, et al.
VCBench:在风险投资中对LLMs进行基准测试
基准
数据集
Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.
MedReseacher-R1:基于知识引导轨迹合成框架的专家级医学深度研究者
检索增强生成
智能问答
Ailing Yu, Lan Yao, Jingnan Liu, et al.
擦除它!通过机器遗忘在代码语言模型中消除敏感记忆
代码生成
LLM
Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.
全景图:具身AI时代全向视觉的崛起
计算机视觉
图像理解
Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.
Hala技术报告:大规模构建以阿拉伯语为中心的指令与翻译模型
LLM
语言
Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem
DeepSeek-R1 通过强化学习激励 LLMs 进行推理
强化学习
LLM
Daya Guo, Dejian Yang, Haowei Zhang, et al.
教LLM进行规划:用于符号规划的逻辑思维链指令微调
LLM
监督式微调
Pulkit Verma, Ngoc La, Anthony Favier, et al.
OpenHA:一系列开源的Minecraft层级化Agent模型
统一多模态
多任务学习
Zihao Wang, Muyao Li, Kaichen He, et al.
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
LLM
Agent
Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.
ReSum:通过上下文摘要解锁长时程搜索智能
Agent
推理
Xixi Wu, Kuan Li, Yida Zhao, et al.
WebResearcher:在长时程Agent中释放无边界推理能力
Agent
推理
Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.
通过环境扩展迈向通用Agent智能
Agent
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:通过合成数据与可扩展强化学习弥合专有Agent的鸿沟
Agent
强化学习
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
通过持续预训练扩展Agent
Agent
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
1
26
27
28
29
30
31
32
49
RPG:用于统一且可扩展代码库生成的仓库规划图
代码生成
LLM
Jane Luo, Xin Zhang, Steven Liu, et al.
合成自举预训练
LLM
合成
Zitong Yang, Aonan Zhang, Hong Liu, et al.
基于再分析数据训练的机器学习天气模型实现精准的全球季节预测
AI for Science
深度学习
Chris Kent, Adam A. Scaife, Nick J. Dunstone, et al.
FinSearchComp:迈向现实的、专家级别的金融搜索与推理评估
基准
Agent
Liang Hu, Jianpeng Jiao, Jiashuo Liu, et al.
生成之前先理解:自引导训练用于自回归图像生成
图像生成
图像理解
Xiaoyu Yue, Zidong Wang, Yuqing Wang, et al.
无标签的演化语言模型:多数驱动选择,新颖促进变异
强化学习
推理
Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.
边界推理:通过推理时反思提升规范对齐
LLM
推理
Haoran Zhang, Yafu Li, Xuyang Hu, et al.
FlowRL:为LLM推理匹配奖励分布
强化学习
LLM
Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.
ScaleCUA:基于跨平台数据的开源计算机使用Agent扩展
Agent
数据集
Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.
大型预训练视觉语言模型能否有效担任施工安全检查员?
视觉问答
图像描述
Xuezheng Chen, Zhengbo Zou
HTSC-2025:面向AI驱动临界温度预测的常压高温超导体基准数据集
数据集
基准
Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.
不稳定性奇点的发现
AI for Science
深度学习
Yongji Wang, Mehdi Bennani, James Martens, et al.
VCBench:在风险投资中对LLMs进行基准测试
基准
数据集
Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.
MedReseacher-R1:基于知识引导轨迹合成框架的专家级医学深度研究者
检索增强生成
智能问答
Ailing Yu, Lan Yao, Jingnan Liu, et al.
擦除它!通过机器遗忘在代码语言模型中消除敏感记忆
代码生成
LLM
Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.
全景图:具身AI时代全向视觉的崛起
计算机视觉
图像理解
Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.
Hala技术报告:大规模构建以阿拉伯语为中心的指令与翻译模型
LLM
语言
Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem
DeepSeek-R1 通过强化学习激励 LLMs 进行推理
强化学习
LLM
Daya Guo, Dejian Yang, Haowei Zhang, et al.
教LLM进行规划:用于符号规划的逻辑思维链指令微调
LLM
监督式微调
Pulkit Verma, Ngoc La, Anthony Favier, et al.
OpenHA:一系列开源的Minecraft层级化Agent模型
统一多模态
多任务学习
Zihao Wang, Muyao Li, Kaichen He, et al.
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
LLM
Agent
Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.
ReSum:通过上下文摘要解锁长时程搜索智能
Agent
推理
Xixi Wu, Kuan Li, Yida Zhao, et al.
WebResearcher:在长时程Agent中释放无边界推理能力
Agent
推理
Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.
通过环境扩展迈向通用Agent智能
Agent
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:通过合成数据与可扩展强化学习弥合专有Agent的鸿沟
Agent
强化学习
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
通过持续预训练扩展Agent
Agent
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
1
26
27
28
29
30
31
32
49