HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
DesignLab:通过迭代检测与修正设计幻灯片
人机交互
文档理解
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
Yume:一个交互式世界生成模型
图生视频
扩散模型
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
像素、模式,但无诗意:像人类一样看世界
多模态
基准
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理
视觉问答
医学影像
Xinyao Liu, Diping Song
HySafe-AI:AI系统混合安全架构分析框架:案例研究
LLM
剑桥大学
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
斑马-CoT:一种交叉视觉语言推理数据集
多模态
推理
Ang Li, Charles Wang, Kaiyu Yue, et al.
基于视觉-语言慢思考的半离策略强化学习
强化学习
视觉问答
Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.
上采样关键区域:面向加速扩散变换器的区域自适应潜在采样
扩散模型
图像生成
Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.
《MegaScience:推动科学推理的训练后数据集前沿》
数据集
推理
Run-Ze Fan, Zengzhi Wang, Pengfei Liu
Step-Audio 2 技术报告
LLM
语音生成
Boyong Wu, Chao Yan, Chen Hu, et al.
超越上下文限制:用于长时程推理的潜意识线索
LLM
推理
Hongyin Luo, Nathaniel Morgan, Tina Li, et al.
前沿人工智能风险管理框架实践:风险分析技术报告
建模
安防
Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.
具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究
强化学习
Transformer
Mian Ibad Ali Shah, Enda Barrett, Karl Mason
无需人类参与:自主高质量图像编辑三元组挖掘
图像生成
数据集
Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.
基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑
3D 生成
语义分割
Hayeon Kim, Ji Ha Jang, Se Young Chun
WebShaper:通过信息寻求进行数据合成的Agent化形式化
检索增强生成
Agent
Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.
无形的牵引:为何RLVR可能无法摆脱其起源
强化学习
LLM
Fang Wu, Weihao Xuan, Ximing Lu, et al.
GUI-G^2:用于 GUI 定位的高斯奖励建模
强化学习
目标检测
Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.
MiroMind-M1:通过上下文感知多阶段策略优化在数学推理领域的开源进展
监督式微调
统一多模态
Xingxuan Li, Yao Xiao, Dianwen Ng, et al.
内在无序区域结合蛋白的设计
AI for Science
建模
Kejia Wu, et al
全原子生成模型用于设计蛋白质复合物
Transformer
建模
Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.
RedOne:揭示社交网络服务中的领域特定LLM后训练
LLM
监督式微调
Fei Zhao, Chonggang Lu, Yue Wang, et al.
CSD-VAR:视觉自回归模型中的内容-风格分解
图像生成
合成
Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.
Mono-InternVL-1.5:迈向更经济、更快捷的单片多模态大语言模型
LLM
多模态
Gen Luo, Wenhan Dou, Wenhao Li, et al.
弗兰卡:嵌套马特里欧什卡聚类用于可扩展的视觉表示学习
Transformer
计算机视觉
Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.
一种以数据为中心的框架,用于解决俄语语音生成模型中的音位和韵律挑战
语音生成
统一多模态
Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, et al.
戴上面具的恶魔:扩散型LLM的安全漏洞问题
扩散模型
监督式微调
Zichen Wen, Jiashu Qu, Dongrui Liu, et al.
PrefPalette:基于潜在属性的个性化偏好建模
偏好
自然语言处理
Shuyue Stella Li, Melanie Sclar, Hunter Lang, et al.
CUDA-L1:通过对比强化学习提升CUDA优化
LLM
AI 编译器
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
AnyCap 项目:可控全模态标题生成的统一框架、数据集和基准测试
统一多模态
数据集
Yiming Ren, Zhiqiang Lin, Yu Li, et al.
Diffuman4D:基于稀疏视角视频和时空扩散模型的4D一致人体视图合成
扩散模型
合成
Yudong Jin, Sida Peng, Xuan Wang, et al.
《模仿游戏:图灵机模仿者是长度泛化的推理者》
LLM
推理
Zhouqi Hua, Wenwei Zhang, Chengqi Lyu, et al.
1
38
39
40
41
42
43
44
49
DesignLab:通过迭代检测与修正设计幻灯片
人机交互
文档理解
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
Yume:一个交互式世界生成模型
图生视频
扩散模型
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
像素、模式,但无诗意:像人类一样看世界
多模态
基准
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理
视觉问答
医学影像
Xinyao Liu, Diping Song
HySafe-AI:AI系统混合安全架构分析框架:案例研究
LLM
剑桥大学
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
斑马-CoT:一种交叉视觉语言推理数据集
多模态
推理
Ang Li, Charles Wang, Kaiyu Yue, et al.
基于视觉-语言慢思考的半离策略强化学习
强化学习
视觉问答
Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.
上采样关键区域:面向加速扩散变换器的区域自适应潜在采样
扩散模型
图像生成
Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.
《MegaScience:推动科学推理的训练后数据集前沿》
数据集
推理
Run-Ze Fan, Zengzhi Wang, Pengfei Liu
Step-Audio 2 技术报告
LLM
语音生成
Boyong Wu, Chao Yan, Chen Hu, et al.
超越上下文限制:用于长时程推理的潜意识线索
LLM
推理
Hongyin Luo, Nathaniel Morgan, Tina Li, et al.
前沿人工智能风险管理框架实践:风险分析技术报告
建模
安防
Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.
具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究
强化学习
Transformer
Mian Ibad Ali Shah, Enda Barrett, Karl Mason
无需人类参与:自主高质量图像编辑三元组挖掘
图像生成
数据集
Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.
基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑
3D 生成
语义分割
Hayeon Kim, Ji Ha Jang, Se Young Chun
WebShaper:通过信息寻求进行数据合成的Agent化形式化
检索增强生成
Agent
Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.
无形的牵引:为何RLVR可能无法摆脱其起源
强化学习
LLM
Fang Wu, Weihao Xuan, Ximing Lu, et al.
GUI-G^2:用于 GUI 定位的高斯奖励建模
强化学习
目标检测
Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.
MiroMind-M1:通过上下文感知多阶段策略优化在数学推理领域的开源进展
监督式微调
统一多模态
Xingxuan Li, Yao Xiao, Dianwen Ng, et al.
内在无序区域结合蛋白的设计
AI for Science
建模
Kejia Wu, et al
全原子生成模型用于设计蛋白质复合物
Transformer
建模
Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.
RedOne:揭示社交网络服务中的领域特定LLM后训练
LLM
监督式微调
Fei Zhao, Chonggang Lu, Yue Wang, et al.
CSD-VAR:视觉自回归模型中的内容-风格分解
图像生成
合成
Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.
Mono-InternVL-1.5:迈向更经济、更快捷的单片多模态大语言模型
LLM
多模态
Gen Luo, Wenhan Dou, Wenhao Li, et al.
弗兰卡:嵌套马特里欧什卡聚类用于可扩展的视觉表示学习
Transformer
计算机视觉
Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.
一种以数据为中心的框架,用于解决俄语语音生成模型中的音位和韵律挑战
语音生成
统一多模态
Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, et al.
戴上面具的恶魔:扩散型LLM的安全漏洞问题
扩散模型
监督式微调
Zichen Wen, Jiashu Qu, Dongrui Liu, et al.
PrefPalette:基于潜在属性的个性化偏好建模
偏好
自然语言处理
Shuyue Stella Li, Melanie Sclar, Hunter Lang, et al.
CUDA-L1:通过对比强化学习提升CUDA优化
LLM
AI 编译器
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
AnyCap 项目:可控全模态标题生成的统一框架、数据集和基准测试
统一多模态
数据集
Yiming Ren, Zhiqiang Lin, Yu Li, et al.
Diffuman4D:基于稀疏视角视频和时空扩散模型的4D一致人体视图合成
扩散模型
合成
Yudong Jin, Sida Peng, Xuan Wang, et al.
《模仿游戏:图灵机模仿者是长度泛化的推理者》
LLM
推理
Zhouqi Hua, Wenwei Zhang, Chengqi Lyu, et al.
1
38
39
40
41
42
43
44
49