HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
推理

推理

Reasoning是指通过逻辑分析和推理来解决问题和做出决策的过程。其目标是提高决策的准确性和效率，确保基于现有数据和知识得出合理结论。在人工智能领域，Reasoning的应用价值尤为突出，能够帮助机器理解复杂情境，进行自主学习和优化，广泛应用于智能助手、自动驾驶、医疗诊断等场景。

常识推理

82 篇论文 | 24 个基准测试

零样本视频问答

66 篇论文 | 16 个基准测试

数学应用题求解

71 篇论文 | 13 个基准测试

视觉推理

46 篇论文 | 12 个基准测试

三维人体重建

29 篇论文 | 10 个基准测试

逻辑推理

7 篇论文 | 10 个基准测试

自动定理证明

28 篇论文 | 9 个基准测试

视觉常识推理

2 篇论文 | 7 个基准测试

算术推理

56 篇论文 | 5 个基准测试

多模态推理

3 篇论文 | 3 个基准测试

程序修复

5 篇论文 | 3 个基准测试

视觉蕴含

11 篇论文 | 3 个基准测试

错误理解

4 篇论文 | 2 个基准测试

人类判断相关性

3 篇论文 | 2 个基准测试

抽象代数

1 篇论文 | 1 个基准测试

类比相似度

2 篇论文 | 1 个基准测试

分析蕴含

2 篇论文 | 1 个基准测试

大学数学

1 篇论文 | 1 个基准测试

强化学习常识推理

1 篇论文 | 1 个基准测试

标题歧义

2 篇论文 | 1 个基准测试

粗俗人工智能

3 篇论文 | 1 个基准测试

决策

1 篇论文 | 1 个基准测试

初等数学

1 篇论文 | 1 个基准测试

蕴含极性

2 篇论文 | 1 个基准测试

评估信息重要性

2 篇论文 | 1 个基准测试

形式逻辑

1 篇论文 | 1 个基准测试

高中数学

1 篇论文 | 1 个基准测试

人类判断分类

2 篇论文 | 1 个基准测试

识别奇异隐喻

2 篇论文 | 1 个基准测试

图像段落字幕生成

10 篇论文 | 1 个基准测试

逻辑参数

2 篇论文 | 1 个基准测试

数学归纳法

2 篇论文 | 1 个基准测试

隐喻布尔

2 篇论文 | 1 个基准测试

自然语言视觉定位

13 篇论文 | 1 个基准测试

找不同

2 篇论文 | 1 个基准测试

物理常识推理

1 篇论文 | 1 个基准测试

物理直觉

2 篇论文 | 1 个基准测试

预设作为自然语言推理

2 篇论文 | 1 个基准测试

专业会计

1 篇论文 | 1 个基准测试

时序序列

1 篇论文 | 1 个基准测试

基于视频的生成性能基准测试

19 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (信息正确性)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (细节导向)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (上下文理解)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (时序理解)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (一致性)

16 篇论文 | 1 个基准测试

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
推理

推理

Reasoning是指通过逻辑分析和推理来解决问题和做出决策的过程。其目标是提高决策的准确性和效率，确保基于现有数据和知识得出合理结论。在人工智能领域，Reasoning的应用价值尤为突出，能够帮助机器理解复杂情境，进行自主学习和优化，广泛应用于智能助手、自动驾驶、医疗诊断等场景。

常识推理

82 篇论文 | 24 个基准测试

零样本视频问答

66 篇论文 | 16 个基准测试

数学应用题求解

71 篇论文 | 13 个基准测试

视觉推理

46 篇论文 | 12 个基准测试

三维人体重建

29 篇论文 | 10 个基准测试

逻辑推理

7 篇论文 | 10 个基准测试

自动定理证明

28 篇论文 | 9 个基准测试

视觉常识推理

2 篇论文 | 7 个基准测试

算术推理

56 篇论文 | 5 个基准测试

多模态推理

3 篇论文 | 3 个基准测试

程序修复

5 篇论文 | 3 个基准测试

视觉蕴含

11 篇论文 | 3 个基准测试

错误理解

4 篇论文 | 2 个基准测试

人类判断相关性

3 篇论文 | 2 个基准测试

抽象代数

1 篇论文 | 1 个基准测试

类比相似度

2 篇论文 | 1 个基准测试

分析蕴含

2 篇论文 | 1 个基准测试

大学数学

1 篇论文 | 1 个基准测试

强化学习常识推理

1 篇论文 | 1 个基准测试

标题歧义

2 篇论文 | 1 个基准测试

粗俗人工智能

3 篇论文 | 1 个基准测试

决策

1 篇论文 | 1 个基准测试

初等数学

1 篇论文 | 1 个基准测试

蕴含极性

2 篇论文 | 1 个基准测试

评估信息重要性

2 篇论文 | 1 个基准测试

形式逻辑

1 篇论文 | 1 个基准测试

高中数学

1 篇论文 | 1 个基准测试

人类判断分类

2 篇论文 | 1 个基准测试

识别奇异隐喻

2 篇论文 | 1 个基准测试

图像段落字幕生成

10 篇论文 | 1 个基准测试

逻辑参数

2 篇论文 | 1 个基准测试

数学归纳法

2 篇论文 | 1 个基准测试

隐喻布尔

2 篇论文 | 1 个基准测试

自然语言视觉定位

13 篇论文 | 1 个基准测试

找不同

2 篇论文 | 1 个基准测试

物理常识推理

1 篇论文 | 1 个基准测试

物理直觉

2 篇论文 | 1 个基准测试

预设作为自然语言推理

2 篇论文 | 1 个基准测试

专业会计

1 篇论文 | 1 个基准测试

时序序列

1 篇论文 | 1 个基准测试

基于视频的生成性能基准测试

19 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (信息正确性)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (细节导向)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (上下文理解)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (时序理解)

16 篇论文 | 1 个基准测试

基于视频的生成性能基准测试 (一致性)

16 篇论文 | 1 个基准测试

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili