最新的 AI 大模型(LLM)评分天梯排行榜,综合了 10 项评测:GDPval-AA、τ²-Bench Telecom、Terminal-Bench Hard、SciCode、AA-LCR、AA-Omniscience、IFBench、Humanity's Last Exam、GPQA Diamond、CritPt
| \ | 谷歌 | OpenAI | Anthropic | Meta | 智谱AI | 阿里巴巴 | MiniMax | 小米 | xAI | 月之暗面 | 深度求索 | AWS | KAT | Nvidia | LG | 昆仑万维 | 英伟达 | Mistral |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 55-59 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ||
| 50-54 | - | - | - | - | - | - | - | - | - | - | - | - | ||||||
| 45-49 | - | - | - | - | - | - | - | - | - | - | - | |||||||
| 40-44 | - | - | - | - | - | - | - | - | - | |||||||||
| 35-39 | - | - | - | - | - | - | - | - | ||||||||||
| 30-34 | - | - | - | - | - | - | - | - | - | - | - | |||||||
| 25-29 | - | - | - | - | - | - | - | - | - | - | - | - | - | |||||
| 20-24 | - | - | - | - | - | - | - | - | - | - | - | - | - | |||||
| 15-19 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |||
| 10-14 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |||
| 5-9 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | |
| 0-4 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |