大模型天梯

最新的 AI 大模型(LLM)评分天梯排行榜,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt

\ 谷歌 OpenAI Anthropic Meta 智谱AI 阿里巴巴 MiniMax 小米 xAI 月之暗面 深度求索 AWS KAT Nvidia LG 昆仑万维 英伟达 Mistral
55-59 - - - - - - - - - - - - - - - -
50-54 - - - - - - - - - - - -
45-49 - - - - - - - - - - -
40-44 - - - - - - - - -
35-39
- - - - - - - -
30-34 - - - - - - - - - - -
25-29 - - - - - - - - - - - - -
20-24 - - - - - - - - - - - - -
15-19 - - - - - - - - - - - - - - -
10-14 - - - - - - - - - - - - - - -
5-9 - - - - - - - - - - - - - - - - -
0-4 - - - - - - - - - - - - - - - - - -