推理
Reasoning是指通过逻辑分析和推理来解决问题和做出决策的过程。其目标是提高决策的准确性和效率,确保基于现有数据和知识得出合理结论。在人工智能领域,Reasoning的应用价值尤为突出,能够帮助机器理解复杂情境,进行自主学习和优化,广泛应用于智能助手、自动驾驶、医疗诊断等场景。
三维人体重建
29 篇论文 | 10 个基准测试
常识推理
81 篇论文 | 24 个基准测试
时序序列
1 篇论文 | 1 个基准测试
物理直觉
2 篇论文 | 1 个基准测试
自然语言视觉定位
13 篇论文 | 1 个基准测试
零样本视频问答
65 篇论文 | 16 个基准测试
视觉推理
45 篇论文 | 12 个基准测试
决策
1 篇论文 | 1 个基准测试
找不同
2 篇论文 | 1 个基准测试
基于视频的生成性能基准测试
19 篇论文 | 1 个基准测试
抽象代数
1 篇论文 | 1 个基准测试
程序修复
5 篇论文 | 3 个基准测试
图像段落字幕生成
10 篇论文 | 1 个基准测试
基于视频的生成性能基准测试 (上下文理解)
16 篇论文 | 1 个基准测试
基于视频的生成性能基准测试 (信息正确性)
16 篇论文 | 1 个基准测试
基于视频的生成性能基准测试 (细节导向)
16 篇论文 | 1 个基准测试
基于视频的生成性能基准测试 (时序理解)
16 篇论文 | 1 个基准测试
基于视频的生成性能基准测试 (一致性)
16 篇论文 | 1 个基准测试
视觉常识推理
2 篇论文 | 7 个基准测试
形式逻辑
1 篇论文 | 1 个基准测试
自动定理证明
27 篇论文 | 9 个基准测试
算术推理
55 篇论文 | 5 个基准测试
错误理解
4 篇论文 | 2 个基准测试
数学归纳法
2 篇论文 | 1 个基准测试
物理常识推理
1 篇论文 | 1 个基准测试
类比相似度
2 篇论文 | 1 个基准测试
初等数学
1 篇论文 | 1 个基准测试
逻辑推理
7 篇论文 | 10 个基准测试
数学应用题求解
70 篇论文 | 13 个基准测试
多模态推理
3 篇论文 | 3 个基准测试
视觉蕴含
11 篇论文 | 3 个基准测试
人类判断相关性
3 篇论文 | 2 个基准测试
高中数学
1 篇论文 | 1 个基准测试
大学数学
1 篇论文 | 1 个基准测试
粗俗人工智能
3 篇论文 | 1 个基准测试
分析蕴含
2 篇论文 | 1 个基准测试
标题歧义
2 篇论文 | 1 个基准测试
蕴含极性
2 篇论文 | 1 个基准测试
评估信息重要性
2 篇论文 | 1 个基准测试
人类判断分类
2 篇论文 | 1 个基准测试
识别奇异隐喻
2 篇论文 | 1 个基准测试
逻辑参数
2 篇论文 | 1 个基准测试
隐喻布尔
2 篇论文 | 1 个基准测试
预设作为自然语言推理
2 篇论文 | 1 个基准测试
强化学习常识推理
1 篇论文 | 1 个基准测试
专业会计
1 篇论文 | 1 个基准测试