Restez informé — Recevez les dernières actualités IA
Leaderboard LLM 2026 — Top 50 des modèles de langage
Classement des meilleurs modèles d'IA • Source : Artificial Analysis • Mise à jour : 10 janvier 2026
GPT-5.2 (xhigh)
OpenAI
Modèle flagship d'OpenAI, le plus performant sur les benchmarks d'intelligence.
Claude Opus 4.5
Anthropic
Modèle le plus puissant d'Anthropic, excelle en analyse complexe et rédaction.
Gemini 3 Pro Preview
Modèle de pointe de Google avec fenêtre de contexte massive.
GPT-5.1 (high)
OpenAI
Version optimisée de GPT-5 avec excellent rapport qualité/performance.
Gemini 3 Flash
Modèle rapide et efficace de Google, bon rapport qualité/vitesse.
Claude 4.5 Sonnet
Anthropic
Meilleur rapport qualité/prix d'Anthropic, excelle en analyse et coding.
GLM-4.7
Z AI (Zhipu)
Modèle chinois performant avec excellent rapport coût/performance.
Grok 4
xAI
Modèle de xAI (Elon Musk), performant en raisonnement et actualités.
DeepSeek V3.2
DeepSeek
Modèle chinois open-source avec excellent rapport coût/performance.
o3
OpenAI
Modèle de raisonnement avancé d'OpenAI pour les tâches complexes.
GPT-5 mini (high)
OpenAI
Version compacte de GPT-5, rapide et économique.
Kimi K2 Thinking
Kimi (Moonshot)
Modèle chinois avec capacités de raisonnement avancées.
MiniMax-M2.1
MiniMax
Modèle chinois performant avec bon rapport qualité/prix.
MiMo-V2-Flash
Xiaomi
Modèle de Xiaomi optimisé pour la vitesse et le coût.
Grok 4.1 Fast
xAI
Version rapide de Grok 4 pour les réponses instantanées.
GPT-5.1 Codex (high)
OpenAI
Modèle spécialisé coding d'OpenAI.
Claude 4.5 Haiku
Anthropic
Modèle léger et rapide d'Anthropic, idéal pour les tâches simples.
KAT-Coder-Pro V1
KwaiKAT
Modèle spécialisé coding de Kuaishou (Kwai).
Nova 2.0 Pro Preview
Amazon
Modèle d'Amazon Bedrock pour les entreprises.
Gemini 2.5 Pro
Modèle mature de Google avec excellentes performances.
DeepSeek V3.2 Speciale
DeepSeek
Version spécialisée de DeepSeek V3.2.
DeepSeek V3.1 Terminus
DeepSeek
Modèle DeepSeek optimisé pour les tâches terminales.
Qwen3 Max Thinking
Alibaba
Modèle de raisonnement avancé d'Alibaba.
Grok 3 mini Reasoning
xAI
Version compacte de Grok avec raisonnement avancé.
K-EXAONE
LG AI Research
Modèle coréen de LG, gratuit et performant.
Qwen3 Max
Alibaba
Modèle flagship d'Alibaba pour les entreprises.
Nova 2.0 Lite
Amazon
Version légère de Nova pour les tâches simples.
Llama 4 405B
Meta
Plus grand modèle open-source de Meta.
Mistral Large 3
Mistral AI
Modèle français performant avec hébergement EU.
Command R+ 2
Cohere
Modèle optimisé pour le RAG et les entreprises.
Llama 4 70B
Meta
Modèle open-source de taille moyenne de Meta.
Phi-4
Microsoft
Petit modèle très performant de Microsoft.
Mistral Small 3
Mistral AI
Modèle compact français pour les tâches courantes.
Claude 3.5 Sonnet
Anthropic
Version précédente de Claude Sonnet, toujours très performante.
Gemma 3 27B
Modèle open-source de Google, compact et efficace.
Llama 4 8B
Meta
Petit modèle open-source de Meta, idéal pour l'edge.
| Rang | Modèle | Provider | Points forts | |
|---|---|---|---|---|
| 1 | GPT-5.2 (xhigh) Modèle flagship d'OpenAI, le plus performant sur les benchmarks d'intelligence. | OpenAI | Intelligence maximaleRaisonnementCoding | Détails → |
| 2 | Claude Opus 4.5 Modèle le plus puissant d'Anthropic, excelle en analyse complexe et rédaction. | Anthropic | Raisonnement complexeAnalyseRédaction | Détails → |
| 3 | Gemini 3 Pro Preview Modèle de pointe de Google avec fenêtre de contexte massive. | Contexte ultra-longMultimodalRecherche | Détails → | |
| 4 | GPT-5.1 (high) Version optimisée de GPT-5 avec excellent rapport qualité/performance. | OpenAI | PolyvalentRaisonnementCoding | Détails → |
| 5 | Gemini 3 Flash Modèle rapide et efficace de Google, bon rapport qualité/vitesse. | VitesseCoûtContexte long | Détails → | |
| 6 | Claude 4.5 Sonnet Meilleur rapport qualité/prix d'Anthropic, excelle en analyse et coding. | Anthropic | AnalyseCodingContexte long | Détails → |
| 7 | GLM-4.7 Modèle chinois performant avec excellent rapport coût/performance. | Z AI (Zhipu) | MultilingueCoûtPerformances | Détails → |
| 8 | Grok 4 Modèle de xAI (Elon Musk), performant en raisonnement et actualités. | xAI | RaisonnementActualités temps réelContexte long | Détails → |
| 9 | DeepSeek V3.2 Modèle chinois open-source avec excellent rapport coût/performance. | DeepSeek | Open-sourceCoût très basPerformances | Détails → |
| 10 | o3 Modèle de raisonnement avancé d'OpenAI pour les tâches complexes. | OpenAI | Raisonnement avancéMathématiquesCoding | Détails → |
| 11 | GPT-5 mini (high) Version compacte de GPT-5, rapide et économique. | OpenAI | VitesseCoûtPolyvalent | Détails → |
| 12 | Kimi K2 Thinking Modèle chinois avec capacités de raisonnement avancées. | Kimi (Moonshot) | RaisonnementCoûtPerformances | Détails → |
| 13 | MiniMax-M2.1 Modèle chinois performant avec bon rapport qualité/prix. | MiniMax | PerformancesCoûtMultilingue | Détails → |
| 14 | MiMo-V2-Flash Modèle de Xiaomi optimisé pour la vitesse et le coût. | Xiaomi | VitesseCoût très basEfficacité | Détails → |
| 15 | Grok 4.1 Fast Version rapide de Grok 4 pour les réponses instantanées. | xAI | VitesseContexte longCoût | Détails → |
| 16 | GPT-5.1 Codex (high) Modèle spécialisé coding d'OpenAI. | OpenAI | CodingGénération de codeDebugging | Détails → |
| 17 | Claude 4.5 Haiku Modèle léger et rapide d'Anthropic, idéal pour les tâches simples. | Anthropic | VitesseCoûtEfficacité | Détails → |
| 18 | KAT-Coder-Pro V1 Modèle spécialisé coding de Kuaishou (Kwai). | KwaiKAT | CodingOpen-sourceGratuit | Détails → |
| 19 | Nova 2.0 Pro Preview Modèle d'Amazon Bedrock pour les entreprises. | Amazon | AWS intégrationEnterpriseSécurité | Détails → |
| 20 | Grok 4 Fast Version optimisée de Grok 4 pour la vitesse. | xAI | VitesseContexte ultra-longCoût | Détails → |
| 21 | Gemini 2.5 Pro Modèle mature de Google avec excellentes performances. | StabilitéMultimodalContexte long | Détails → | |
| 22 | DeepSeek V3.2 Speciale Version spécialisée de DeepSeek V3.2. | DeepSeek | PerformancesCoûtSpécialisé | Détails → |
| 23 | DeepSeek V3.1 Terminus Modèle DeepSeek optimisé pour les tâches terminales. | DeepSeek | PerformancesCoûtOpen-source | Détails → |
| 24 | Doubao Seed Code Modèle coding de ByteDance (TikTok). | ByteDance | CodingCoûtPerformances | Détails → |
| 25 | gpt-os-120B (high) Modèle open-source d'OpenAI. | OpenAI | VitesseCoûtEfficacité | Détails → |
| 26 | Qwen3 Max Thinking Modèle de raisonnement avancé d'Alibaba. | Alibaba | RaisonnementMultilinguePerformances | Détails → |
| 27 | Grok 3 mini Reasoning Version compacte de Grok avec raisonnement avancé. | xAI | RaisonnementVitesseCoût | Détails → |
| 28 | K-EXAONE Modèle coréen de LG, gratuit et performant. | LG AI Research | GratuitPerformancesMultilingue | Détails → |
| 29 | Qwen3 Max Modèle flagship d'Alibaba pour les entreprises. | Alibaba | MultilinguePerformancesOpen-weights | Détails → |
| 30 | Nova 2.0 Lite Version légère de Nova pour les tâches simples. | Amazon | VitesseCoûtAWS intégration | Détails → |
| 31 | Qwen3 235B A22B Grand modèle Qwen avec architecture MoE. | Alibaba | PerformancesMultilingueMoE | Détails → |
| 32 | ERNIE 5.0 Thinking Modèle de raisonnement de Baidu. | Baidu | RaisonnementChinoisPerformances | Détails → |
| 33 | Qwen3 VL 32B Modèle vision-langage d'Alibaba. | Alibaba | VisionMultimodalPerformances | Détails → |
| 34 | Nova 2.0 Omni Modèle multimodal d'Amazon. | Amazon | MultimodalAWSEnterprise | Détails → |
| 35 | Kimi K2 0905 Version mise à jour de Kimi K2. | Kimi (Moonshot) | PerformancesCoûtContexte long | Détails → |
| 36 | GPT-5.1 Codex mini Version compacte du modèle Codex. | OpenAI | CodingVitesseCoût | Détails → |
| 37 | Llama 4 405B Plus grand modèle open-source de Meta. | Meta | Open-sourcePerformancesCustomisable | Détails → |
| 38 | Mistral Large 3 Modèle français performant avec hébergement EU. | Mistral AI | EU hostingMultilingueCoding | Détails → |
| 39 | Command R+ 2 Modèle optimisé pour le RAG et les entreprises. | Cohere | RAG optimiséEnterpriseGrounding | Détails → |
| 40 | Gemini 2.5 Flash Version rapide de Gemini 2.5. | VitesseCoûtMultimodal | Détails → | |
| 41 | Yi-Lightning Modèle chinois rapide et performant. | 01.AI | VitessePerformancesCoût | Détails → |
| 42 | Llama 4 70B Modèle open-source de taille moyenne de Meta. | Meta | Open-sourceÉquilibréCustomisable | Détails → |
| 43 | Phi-4 Petit modèle très performant de Microsoft. | Microsoft | CompactPerformancesEdge deployment | Détails → |
| 44 | Mistral Small 3 Modèle compact français pour les tâches courantes. | Mistral AI | VitesseEU hostingCoût | Détails → |
| 45 | GPT-4o mini Version économique de GPT-4o. | OpenAI | Coût très basVitessePolyvalent | Détails → |
| 46 | Claude 3.5 Sonnet Version précédente de Claude Sonnet, toujours très performante. | Anthropic | ÉquilibréCodingAnalyse | Détails → |
| 47 | Qwen2.5 72B Modèle open-weights performant d'Alibaba. | Alibaba | Open-weightsMultilingueCoding | Détails → |
| 48 | Gemma 3 27B Modèle open-source de Google, compact et efficace. | Open-sourceCompactEfficace | Détails → | |
| 49 | Codestral Modèle spécialisé coding de Mistral. | Mistral AI | CodingEU hostingPerformances | Détails → |
| 50 | Llama 4 8B Petit modèle open-source de Meta, idéal pour l'edge. | Meta | Open-sourceCompactEdge deployment | Détails → |
Sources de benchmarks LLM
Artificial Analysis
Leaderboard de référence comparant les LLMs sur intelligence, prix, vitesse et latence.
LMSYS Chatbot Arena
Leaderboard communautaire basé sur des votes humains comparant les LLMs.
Hugging Face Open LLM Leaderboard
Classement open-source des LLMs sur des benchmarks standardisés.
Stanford HELM
Benchmark holistique pour évaluer les modèles de langage.
