leaderboard AI 基准评测

来自 Artificial Analysis 的综合模型能力评测数据,实时同步。

AA Agentic Index· agent

518 个模型 · 满分 1.0

Kimi K2.6
66.000
MiMo-V2.5
65.500
Grok-1
59.100
R1 1776
59.100
Llama 65B
59.100
o1-mini
59.100
o1-pro
59.100
o3-pro
59.100
GPT-4
59.100
o3-mini
59.100
PALM-2
59.100
Sonar
59.100
Sonar Pro
59.100
Grok Beta
59.100
LFM 40B
59.100
OLMo 2 7B
59.100
QwQ 32B
59.100
Qwen3 Max
43.000
JT-MINI
42.400
Grok 4
41.500
Mercury 2
39.700
o3
36.100
o1
31.100
GPT-4.1
27.300
Grok 3
24.600
Kimi K2
24.300
Ring-1T
18.300
Ling-1T
11.800
Phi-4
0.000

数据来源:Artificial Analysis · 定期同步