大模型天梯

Artificial Analysis Intelligence Index v4.0,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt

\ 谷歌 OpenAI Anthropic 智谱AI 月之暗面 阿里巴巴 深度求索 MiniMax 小米 xAI AWS KAT LG 昆仑万维 英伟达 Mistral Meta
56-60 - - - - - - - - - - - - - - - -
51-55 - - - - - - - - - - - - - - -
46-50 - - - - - - - - - - - -
41-45 - - - - - - - -
36-40 - - - - - - - - - - - -
31-35 - - - - - - - - - -
26-30 - - - - - - - - - - - - - -
21-25 - - - - - - - - - - - - -
16-20 - - - - - - - - - - - - - -
11-15 - - - - - - - - - - - - - - -
6-10 - - - - - - - - - - - - - - - -
0-5 - - - - - - - - - - - - - - - - -