HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
重新思考驾驶世界模型作为感知任务的合成数据生成器
视频生成
自动驾驶
Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.
空间可变对焦
深度估计
计算机视觉
Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole
何时进行集成:识别用于稳定且快速LLM集成的token级点
LLM
Transformer
Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.
面向通用检索增强生成的混合模态检索
检索增强生成
多模态
Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.
FineVision:开放数据即所需全部
多模态
统一多模态
Luis Wiedmann, Orr Zohar, Amir Mahla, et al.
Glyph:通过视觉-文本压缩扩展上下文窗口
视觉问答
文档理解
Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.
PICABench:我们离物理上真实的图像编辑还有多远?
图像修复
图生图
Yuandong Pu, Le Zhuo, Songhao Han, et al.
DeepAnalyze:用于自主数据科学的智能体大型语言模型
LLM
Agent
Shaolei Zhang, Ju Fan, Meihao Fan, et al.
基于自注意力机制的算子学习3D-IC热仿真
AI for Science
Transformer
Zhen Huang, Hong Wang, Wenkai Yang, et al.
Earth AI:基于基础模型与跨模态推理解锁地理空间洞察
多模态
推理
Aaron Bell, Amit Aides, Amr Helmy, et al.
从统计学视角重新思考跨语言鸿沟
LLM
自然语言处理
Vihari Piratla, Purvam Jain, Darshan Singh, et al.
通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议
推理
LLM
Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.
Skyfall-GS:从卫星影像合成沉浸式3D城市场景
3D 生成
扩散模型
Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.
上下文学习导致的涌现性错位:有限的上下文示例可导致广泛错位的LLM
LLM
推理
Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.
NANO3D:一种无需训练的高效3D编辑方法,无需掩码
3D 模型
图像修复
Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.
基于指令的视频编辑的规模化:高质量合成数据集
统一多模态
合成
Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.
OmniVinci:提升架构与数据以实现全模态理解 LLM
多模态表征
统一多模态
Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.
关于LLM推理中内部概率与自洽性衔接的理论研究
推理
LLM
Zhi Zhou, Yuhao Tan, Zenan Li, et al.
DeepSeek-OCR:上下文光学压缩
OCR
LLM
Haoran Wei, Yaofeng Sun, Yukun Li
带有未观测偏好异质性的直接偏好优化:三元偏好必要性
偏好
LLM
Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis
用于概率天气预报的滚动扩散模型阐释
扩散模型
深度学习
Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.
图像搜索:超越语义依赖约束的视频生成自适应测试时搜索
统一多模态
文生视频
Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.
从像素到文字——迈向大规模原生视觉-语言原子单元
多模态
多模态表征
Haiwen Diao, Mingxuan Li, Silei Wu, et al.
面向服务的AI:通过AI眼镜实现主动辅助
Agent
多模态
Zichen Wen, Yiyu Wang, Chenfei Liao, et al.
WithAnyone:迈向可控且ID一致的图像生成
文生图
图像生成
Hengyuan Xu, Wei Cheng, Peng Xing, et al.
代理熵平衡策略优化
强化学习
Agent
Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.
当模型说谎时,我们得以学习:基于PsiloQA的多语言跨度级幻觉检测
数据集
LLM
Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.
基于深度学习预测多模板PCR中的序列特异性扩增效率
深度学习
卷积神经网络
Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.
基因组分析工具:一种用于分析下一代DNA测序数据的MapReduce框架
基因组学
高性能计算
Aaron McKenna, Matthew Hanna, Eric Banks, et al.
LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具
建模
高性能计算
Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.
LabOS:能够感知并协同人类的AI-XR共科研人员
Le Cong, Zaixi Zhang, Xiaotong Wang, et al.
海豚:基于异构锚点提示的文档图像解析
文档理解
多模态
Hao Feng, Shu Wei, Xiang Fei, et al.
1
20
21
22
23
24
25
26
49
重新思考驾驶世界模型作为感知任务的合成数据生成器
视频生成
自动驾驶
Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.
空间可变对焦
深度估计
计算机视觉
Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole
何时进行集成:识别用于稳定且快速LLM集成的token级点
LLM
Transformer
Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.
面向通用检索增强生成的混合模态检索
检索增强生成
多模态
Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.
FineVision:开放数据即所需全部
多模态
统一多模态
Luis Wiedmann, Orr Zohar, Amir Mahla, et al.
Glyph:通过视觉-文本压缩扩展上下文窗口
视觉问答
文档理解
Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.
PICABench:我们离物理上真实的图像编辑还有多远?
图像修复
图生图
Yuandong Pu, Le Zhuo, Songhao Han, et al.
DeepAnalyze:用于自主数据科学的智能体大型语言模型
LLM
Agent
Shaolei Zhang, Ju Fan, Meihao Fan, et al.
基于自注意力机制的算子学习3D-IC热仿真
AI for Science
Transformer
Zhen Huang, Hong Wang, Wenkai Yang, et al.
Earth AI:基于基础模型与跨模态推理解锁地理空间洞察
多模态
推理
Aaron Bell, Amit Aides, Amr Helmy, et al.
从统计学视角重新思考跨语言鸿沟
LLM
自然语言处理
Vihari Piratla, Purvam Jain, Darshan Singh, et al.
通过结构化组件化奖励机制释放科学推理能力以生成生物实验协议
推理
LLM
Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.
Skyfall-GS:从卫星影像合成沉浸式3D城市场景
3D 生成
扩散模型
Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.
上下文学习导致的涌现性错位:有限的上下文示例可导致广泛错位的LLM
LLM
推理
Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.
NANO3D:一种无需训练的高效3D编辑方法,无需掩码
3D 模型
图像修复
Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.
基于指令的视频编辑的规模化:高质量合成数据集
统一多模态
合成
Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.
OmniVinci:提升架构与数据以实现全模态理解 LLM
多模态表征
统一多模态
Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.
关于LLM推理中内部概率与自洽性衔接的理论研究
推理
LLM
Zhi Zhou, Yuhao Tan, Zenan Li, et al.
DeepSeek-OCR:上下文光学压缩
OCR
LLM
Haoran Wei, Yaofeng Sun, Yukun Li
带有未观测偏好异质性的直接偏好优化:三元偏好必要性
偏好
LLM
Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis
用于概率天气预报的滚动扩散模型阐释
扩散模型
深度学习
Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.
图像搜索:超越语义依赖约束的视频生成自适应测试时搜索
统一多模态
文生视频
Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.
从像素到文字——迈向大规模原生视觉-语言原子单元
多模态
多模态表征
Haiwen Diao, Mingxuan Li, Silei Wu, et al.
面向服务的AI:通过AI眼镜实现主动辅助
Agent
多模态
Zichen Wen, Yiyu Wang, Chenfei Liao, et al.
WithAnyone:迈向可控且ID一致的图像生成
文生图
图像生成
Hengyuan Xu, Wei Cheng, Peng Xing, et al.
代理熵平衡策略优化
强化学习
Agent
Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.
当模型说谎时,我们得以学习:基于PsiloQA的多语言跨度级幻觉检测
数据集
LLM
Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.
基于深度学习预测多模板PCR中的序列特异性扩增效率
深度学习
卷积神经网络
Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.
基因组分析工具:一种用于分析下一代DNA测序数据的MapReduce框架
基因组学
高性能计算
Aaron McKenna, Matthew Hanna, Eric Banks, et al.
LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具
建模
高性能计算
Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.
LabOS:能够感知并协同人类的AI-XR共科研人员
Le Cong, Zaixi Zhang, Xiaotong Wang, et al.
海豚:基于异构锚点提示的文档图像解析
文档理解
多模态
Hao Feng, Shu Wei, Xiang Fei, et al.
1
20
21
22
23
24
25
26
49