大模型天梯

最新的 AI 大模型(LLM)评分天梯排行榜,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt

\ Anthropic OpenAI 阿里巴巴 谷歌 MiniMax 小米 月之暗面 xAI 深度求索 Meta 智谱AI Nvidia 阶跃星辰 腾讯 Mistral AWS KAT LG Upstage 昆仑万维
65-69 - - - - - - - - - - - - - - - - - - -
60-64 - - - - - - - - - - - - - - - - - -
55-59 - - - - - - - - - - - - - - -
50-54 - - - - - - - - - -
45-49 - - - - - - - - - - -
40-44 - - - - - - - - -
35-39
- - - - - - - -
30-34 - - - - - - - - - - - -
25-29 - - - - - - - - - - - - - -
20-24 - - - - - - - - - - - - - - - -
15-19 - - - - - - - - - - - - - - - - -
10-14 - - - - - - - - - - - - - - - - -
5-9 - - - - - - - - - - - - - - - - - - -
0-4 - - - - - - - - - - - - - - - - - - - -