HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

重新思考驾驶世界模型作为感知任务的合成数据生成器

重新思考驾驶世界模型作为感知任务的合成数据生成器

Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.

空间可变对焦

空间可变对焦

计算机视觉

Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole

何时进行集成：识别用于稳定且快速LLM集成的token级点

何时进行集成：识别用于稳定且快速LLM集成的token级点

Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.

面向通用检索增强生成的混合模态检索

面向通用检索增强生成的混合模态检索

检索增强生成

Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.

FineVision：开放数据即所需全部

FineVision：开放数据即所需全部

统一多模态

Luis Wiedmann, Orr Zohar, Amir Mahla, et al.

Glyph：通过视觉-文本压缩扩展上下文窗口

Glyph：通过视觉-文本压缩扩展上下文窗口

Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.

PICABench：我们离物理上真实的图像编辑还有多远？

PICABench：我们离物理上真实的图像编辑还有多远？

Yuandong Pu, Le Zhuo, Songhao Han, et al.

DeepAnalyze：用于自主数据科学的智能体大型语言模型

DeepAnalyze：用于自主数据科学的智能体大型语言模型

Shaolei Zhang, Ju Fan, Meihao Fan, et al.

基于自注意力机制的算子学习3D-IC热仿真

基于自注意力机制的算子学习3D-IC热仿真

Zhen Huang, Hong Wang, Wenkai Yang, et al.

Earth AI：基于基础模型与跨模态推理解锁地理空间洞察

Earth AI：基于基础模型与跨模态推理解锁地理空间洞察

Aaron Bell, Amit Aides, Amr Helmy, et al.

从统计学视角重新思考跨语言鸿沟

从统计学视角重新思考跨语言鸿沟

自然语言处理

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议

通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS：从卫星影像合成沉浸式3D城市场景

Skyfall-GS：从卫星影像合成沉浸式3D城市场景

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

上下文学习导致的涌现性错位：有限的上下文示例可导致广泛错位的LLM

上下文学习导致的涌现性错位：有限的上下文示例可导致广泛错位的LLM

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

NANO3D：一种无需训练的高效3D编辑方法，无需掩码

NANO3D：一种无需训练的高效3D编辑方法，无需掩码

Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.

基于指令的视频编辑的规模化：高质量合成数据集

基于指令的视频编辑的规模化：高质量合成数据集

统一多模态

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci：提升架构与数据以实现全模态理解 LLM

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

关于LLM推理中内部概率与自洽性衔接的理论研究

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR：上下文光学压缩

DeepSeek-OCR：上下文光学压缩

Haoran Wei, Yaofeng Sun, Yukun Li

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

用于概率天气预报的滚动扩散模型阐释

用于概率天气预报的滚动扩散模型阐释

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

统一多模态

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

从像素到文字——迈向大规模原生视觉-语言原子单元

从像素到文字——迈向大规模原生视觉-语言原子单元

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

面向服务的AI：通过AI眼镜实现主动辅助

面向服务的AI：通过AI眼镜实现主动辅助

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone：迈向可控且ID一致的图像生成

WithAnyone：迈向可控且ID一致的图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

代理熵平衡策略优化

代理熵平衡策略优化

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

基于深度学习预测多模板PCR中的序列特异性扩增效率

基于深度学习预测多模板PCR中的序列特异性扩增效率

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS：能够感知并协同人类的AI-XR共科研人员

LabOS：能够感知并协同人类的AI-XR共科研人员

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

海豚：基于异构锚点提示的文档图像解析

海豚：基于异构锚点提示的文档图像解析

Hao Feng, Shu Wei, Xiang Fei, et al.

重新思考驾驶世界模型作为感知任务的合成数据生成器

重新思考驾驶世界模型作为感知任务的合成数据生成器

Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.

空间可变对焦

空间可变对焦

计算机视觉

Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole

何时进行集成：识别用于稳定且快速LLM集成的token级点

何时进行集成：识别用于稳定且快速LLM集成的token级点

Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.

面向通用检索增强生成的混合模态检索

面向通用检索增强生成的混合模态检索

检索增强生成

Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.

FineVision：开放数据即所需全部

FineVision：开放数据即所需全部

统一多模态

Luis Wiedmann, Orr Zohar, Amir Mahla, et al.

Glyph：通过视觉-文本压缩扩展上下文窗口

Glyph：通过视觉-文本压缩扩展上下文窗口

Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.

PICABench：我们离物理上真实的图像编辑还有多远？

PICABench：我们离物理上真实的图像编辑还有多远？

Yuandong Pu, Le Zhuo, Songhao Han, et al.

DeepAnalyze：用于自主数据科学的智能体大型语言模型

DeepAnalyze：用于自主数据科学的智能体大型语言模型

Shaolei Zhang, Ju Fan, Meihao Fan, et al.

基于自注意力机制的算子学习3D-IC热仿真

基于自注意力机制的算子学习3D-IC热仿真

Zhen Huang, Hong Wang, Wenkai Yang, et al.

Earth AI：基于基础模型与跨模态推理解锁地理空间洞察

Earth AI：基于基础模型与跨模态推理解锁地理空间洞察

Aaron Bell, Amit Aides, Amr Helmy, et al.

从统计学视角重新思考跨语言鸿沟

从统计学视角重新思考跨语言鸿沟

自然语言处理

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议

通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS：从卫星影像合成沉浸式3D城市场景

Skyfall-GS：从卫星影像合成沉浸式3D城市场景

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

上下文学习导致的涌现性错位：有限的上下文示例可导致广泛错位的LLM

上下文学习导致的涌现性错位：有限的上下文示例可导致广泛错位的LLM

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

NANO3D：一种无需训练的高效3D编辑方法，无需掩码

NANO3D：一种无需训练的高效3D编辑方法，无需掩码

Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.

基于指令的视频编辑的规模化：高质量合成数据集

基于指令的视频编辑的规模化：高质量合成数据集

统一多模态

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci：提升架构与数据以实现全模态理解 LLM

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

关于LLM推理中内部概率与自洽性衔接的理论研究

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR：上下文光学压缩

DeepSeek-OCR：上下文光学压缩

Haoran Wei, Yaofeng Sun, Yukun Li

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

用于概率天气预报的滚动扩散模型阐释

用于概率天气预报的滚动扩散模型阐释

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

统一多模态

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

从像素到文字——迈向大规模原生视觉-语言原子单元

从像素到文字——迈向大规模原生视觉-语言原子单元

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

面向服务的AI：通过AI眼镜实现主动辅助

面向服务的AI：通过AI眼镜实现主动辅助

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone：迈向可控且ID一致的图像生成

WithAnyone：迈向可控且ID一致的图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

代理熵平衡策略优化

代理熵平衡策略优化

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

基于深度学习预测多模板PCR中的序列特异性扩增效率

基于深度学习预测多模板PCR中的序列特异性扩增效率

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS：能够感知并协同人类的AI-XR共科研人员

LabOS：能够感知并协同人类的AI-XR共科研人员

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

海豚：基于异构锚点提示的文档图像解析

海豚：基于异构锚点提示的文档图像解析

Hao Feng, Shu Wei, Xiang Fei, et al.