最新的 AI 大模型(LLM)评分天梯排行榜,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt
| \ | Anthropic | OpenAI | 阿里巴巴 | 谷歌 | MiniMax | 小米 | 月之暗面 | xAI | 深度求索 | Meta | 智谱AI | Nvidia | 阶跃星辰 | 腾讯 | Mistral | AWS | KAT | LG | Upstage | 昆仑万维 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 65-69 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |
| 60-64 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ||
| 55-59 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |||||
| 50-54 | - | - | - | - | - | - | - | - | - | - | ||||||||||
| 45-49 | - | - | - | - | - | - | - | - | - | - | - | |||||||||
| 40-44 | - | - | - | - | - | - | - | - | - | |||||||||||
| 35-39 | - | - | - | - | - | - | - | - | ||||||||||||
| 30-34 | - | - | - | - | - | - | - | - | - | - | - | - | ||||||||
| 25-29 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ||||||
| 20-24 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ||||
| 15-19 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |||
| 10-14 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |||
| 5-9 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |
| 0-4 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |