大模型天梯

最新的 AI 大模型(LLM)评分天梯排行榜,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt

\ OpenAI 谷歌 Anthropic 小米 月之暗面 xAI 阿里巴巴 深度求索 Meta 智谱AI MiniMax AWS KAT Nvidia LG 昆仑万维 英伟达 Mistral
60-64 - - - - - - - - - - - - - - - - -
55-59 - - - - - - - - - - - - - - -
50-54 - - - - - - - -
45-49 - - - - - - - - - -
40-44 - - - - - - - - -
35-39
- - - - - - - -
30-34 - - - - - - - - - - -
25-29 - - - - - - - - - - - - -
20-24 - - - - - - - - - - - - -
15-19 - - - - - - - - - - - - - - -
10-14 - - - - - - - - - - - - - - -
5-9 - - - - - - - - - - - - - - - - -
0-4 - - - - - - - - - - - - - - - - - -