AI SOTA 基准测试
最新的人工智能模型性能比较、GPU 基准测试以及最新前沿论文
类别
按类别浏览任务
Adversarial
5 个任务
Audio
5 个任务
Computer Code
5 个任务
Computer Vision
5 个任务
Graphs
5 个任务
Knowledge Base
5 个任务
LLM
5 个任务
Medical
5 个任务
Methodology
5 个任务
Miscellaneous
5 个任务
Music
5 个任务
Natural Language Processing
5 个任务
Playing Games
5 个任务
Reasoning
5 个任务
Robots
5 个任务
Speech
5 个任务
Time Series
5 个任务
AI 模型性能基准
主流 AI 模型在各任务上的性能指标比较,展示最前沿的技术水平
Red Teaming
47 篇论文 | 0 个基准测试
Backdoor Attack
36 篇论文 | 0 个基准测试
Adversarial Defense
34 篇论文 | 10 个基准测试
Handwritten Text Recognition
32 篇论文 | 13 个基准测试
Open-Domain Question Answering
30 篇论文 | 15 个基准测试
Target Speaker Extraction
49 篇论文 | 0 个基准测试
Inference Optimization
48 篇论文 | 0 个基准测试
Room Impulse Response (RIR)
46 篇论文 | 0 个基准测试
Bandwidth Extension
45 篇论文 | 6 个基准测试
Voice Cloning
44 篇论文 | 0 个基准测试
Type prediction
44 篇论文 | 3 个基准测试
Compiler Optimization
44 篇论文 | 0 个基准测试
Chart Question Answering
41 篇论文 | 3 个基准测试
Traffic Signal Control
40 篇论文 | 0 个基准测试
Code Translation
37 篇论文 | 2 个基准测试
Image Retrieval
50 篇论文 | 56 个基准测试
Rgb-T Tracking
50 篇论文 | 5 个基准测试
Colorization
50 篇论文 | 2 个基准测试
Color Constancy
50 篇论文 | 1 个基准测试
Human Dynamics
50 篇论文 | 0 个基准测试
Graph Sampling
49 篇论文 | 0 个基准测试
Graph Property Prediction
45 篇论文 | 4 个基准测试
Jet Tagging
44 篇论文 | 1 个基准测试
Triple Classification
44 篇论文 | 1 个基准测试
Style Transfer
42 篇论文 | 3 个基准测试
Ontology Matching
50 篇论文 | 0 个基准测试
Explainable Artificial Intelligence (XAI)
49 篇论文 | 1 个基准测试
Document Summarization
46 篇论文 | 7 个基准测试
Knowledge Graphs
44 篇论文 | 4 个基准测试
Knowledge Base Construction
44 篇论文 | 0 个基准测试
multimodal
78 篇论文 | 79 个基准测试
reasoning
60 篇论文 | 57 个基准测试
understanding
47 篇论文 | 48 个基准测试
other
35 篇论文 | 33 个基准测试
knowledge
27 篇论文 | 30 个基准测试
SSVEP
50 篇论文 | 0 个基准测试
Pharmacovigilance
50 篇论文 | 0 个基准测试
Skin Lesion Segmentation
48 篇论文 | 3 个基准测试
Diabetic Retinopathy Detection
48 篇论文 | 1 个基准测试
Metal Artifact Reduction
48 篇论文 | 0 个基准测试
Bilevel Optimization
50 篇论文 | 3 个基准测试
Classification
49 篇论文 | 71 个基准测试
Computational Efficiency
49 篇论文 | 1 个基准测试
Inductive Learning
49 篇论文 | 0 个基准测试
Entity Embeddings
48 篇论文 | 0 个基准测试
Deep Clustering
50 篇论文 | 5 个基准测试
Physical Simulations
50 篇论文 | 5 个基准测试
Multimodal Recommendation
50 篇论文 | 5 个基准测试
Electrical Engineering
50 篇论文 | 1 个基准测试
Misinformation
49 篇论文 | 1 个基准测试
Music Classification
49 篇论文 | 0 个基准测试
Music Information Retrieval
44 篇论文 | 0 个基准测试
Voice Conversion
41 篇论文 | 3 个基准测试
Music Transcription
40 篇论文 | 6 个基准测试
Video Style Transfer
35 篇论文 | 0 个基准测试
Word Alignment
50 篇论文 | 7 个基准测试
Deep Clustering
50 篇论文 | 5 个基准测试
Semantic Dependency Parsing
50 篇论文 | 3 个基准测试
Sentence Ordering
49 篇论文 | 1 个基准测试
Lemmatization
49 篇论文 | 0 个基准测试
Offline RL
48 篇论文 | 2 个基准测试
Car Racing
48 篇论文 | 0 个基准测试
Real-Time Strategy Games
46 篇论文 | 0 个基准测试
Game Design
43 篇论文 | 0 个基准测试
Video Style Transfer
35 篇论文 | 0 个基准测试
ARC
50 篇论文 | 0 个基准测试
Discrete Choice Models
50 篇论文 | 0 个基准测试
3D Human Reconstruction
48 篇论文 | 10 个基准测试
Causal Identification
46 篇论文 | 0 个基准测试
Common Sense Reasoning
45 篇论文 | 24 个基准测试
Gesture Generation
47 篇论文 | 4 个基准测试
Trajectory Planning
47 篇论文 | 2 个基准测试
Robot Task Planning
46 篇论文 | 3 个基准测试
Benchmarking
45 篇论文 | 2 个基准测试
Visual Odometry
45 篇论文 | 1 个基准测试
Spoken language identification
50 篇论文 | 12 个基准测试
Speech Dereverberation
50 篇论文 | 5 个基准测试
Acoustic Modelling
50 篇论文 | 0 个基准测试
Speech Separation
49 篇论文 | 19 个基准测试
Spoken Dialogue Systems
47 篇论文 | 0 个基准测试
Time Series Prediction
50 篇论文 | 2 个基准测试
Time Series Forecasting
49 篇论文 | 86 个基准测试
Computational Efficiency
49 篇论文 | 1 个基准测试
Activity Prediction
48 篇论文 | 1 个基准测试
Predictive Process Monitoring
48 篇论文 | 0 个基准测试
GPU 基准测试
最新的 GPU 硬件和软件性能评测,帮助您做出明智的硬件选择
软件性能
DeepSeek-R1-Distill-Qwen-7B
环境: vllm
DeepSeek-R1-Distill-Llama-8B
环境: vllm
DeepSeek-R1-Distill-Qwen-14B
环境: vllm
DeepSeek-R1-Distill-Qwen-32B
环境: vllm
DeepSeek-R1-Distill-Llama-70B
环境: vllm
DeepSeek-R1-Distill-Qwen-7B
环境: sglang
DeepSeek-R1-Distill-Llama-8B
环境: sglang
DeepSeek-R1-Distill-Qwen-14B
环境: sglang
DeepSeek-R1-Distill-Qwen-32B
环境: sglang
DeepSeek-R1-Distill-Llama-70B
环境: sglang

TesserAct:学习 4D 具身世界模型
Haoyu Zhen, Qiao Sun, Hongxin Zhang, et al.
发布日期: 4/30/2025

RefVNLI:面向可扩展的主题驱动文本到图像生成评估
Aviv Slobodkin, Hagai Taitelbaum, Yonatan Bitton, et al.
发布日期: 4/30/2025

LIRM:用于形状、材料和视图相关辐射场的渐进重建的大型逆渲染模型
Zhengqin Li, Dilin Wang, Ka Chen, Zhaoyang Lv, et al.
发布日期: 4/30/2025

使用带控制的物理信息神经网络对水下航行器进行建模
Abdelhakim Amer, David Felsager, Yury Brodskiy, et al.
发布日期: 4/30/2025

理解任意视频中的摄像机运动
Zhiqiu Lin, Siyuan Cen, Daniel Jiang, et al.
发布日期: 4/29/2025

Step1X-Edit:一种实用的通用图像编辑框架
Shiyu Liu, Yucheng Han, Peng Xing, et al.
发布日期: 4/29/2025

DreamID:基于三元组身份组学习的高保真快速扩散人脸交换
Fulong Ye, Miao Hua, Pengze Zhang, et al.
发布日期: 4/29/2025