Compar:IA
Démocratiser l'accès aux modèles d'IA conversationnelle pour les français et
françaises et constituer un commun numérique européen.
Publié le lundi 8 décembre 2025 | Accélération
Utilisable
91 modèles
testés depuis le lancement

Utilisé
8 000-24 000 utilisateurs uniques par mois
Plus de 114 000 votes
Plus de 500 000 questions en cumulé

Utile
492 100 questions collectées, valeur d'alignement des modèles pour améliorer leurs capacités dans les cas d'usage en français

Impactant
Sensibilise et favorise la recherche et le développement de modèles en langues européennes.

Quand l'IA parle français avec un accent anglais
Imaginez que vous appreniez à parler le français en lisant principalement des livres en anglais, et une toute petite proportion de livres en français. Vous parlerez français, mais avec des tournures bizarres, des références culturelles décalées, et des erreurs de compréhension. C'est le problème des intelligences artificielles actuelles avec de nombreuses langues européennes. Les grands modèles de langage (LLM) actuels sont entraînés sur des données essentiellement anglo-saxonnes, créant des biais linguistiques et culturels. D'autre part, l'évaluation humaine des modèles sur des tâches en français reste coûteuse et complexe : les corpus d'évaluation existants sont également majoritairement en anglais et ne reflètent pas forcement nos usages francophones.
Face à ce constat, le Ministère de la Culture a développé Compar:IA, une plateforme publique permettant de tester et comparer des modèles d'IA conversationnelle en français tout en constituant un commun numérique pour l'écosystème.
Comment ça fonctionne ?
Compar:IA fonctionne selon le principe suivant :
- Comparaison à l'aveugle : l'utilisateur soumet une question à deux modèles anonymes parmi plus de 20 modèles
- Expression de préférence : l'utilisateur choisit la meilleure réponse
- Révélation et information : l'identité des modèles est dévoilée avec leurs caractéristiques (nom, taille, impact environnemental, etc.)
- Constitution d'un commun : les questions et préférences alimentent des jeux de données open source.
Et surtout : toutes ces questions et préférences sont partagées en open source pour aider à améliorer les IA pour tout le monde.
-
IA frugale
-
Superscale
À propos
Informations clés
- Porteur : L'Atelier Numérique du Ministère de la Culture
- Sponsors : DINUM, Ministère de la Culture
- Phase : Accélération (depuis avril 2025), lancé en janvier 2024
Accès
Site web
compar:IA — Accès libre sans inscription
Fiche technique
- Code source : GitHub
- Technologies : Kubernetes, Python, Gradio, FastAPI, Svelte
- Données ouvertes : Jeux de données disponibles en open source sous licences ouvertes. Lien vers les données ouvertes
Contact
Quel impact pour moi ?
Si vous êtes citoyen, Compar:IA vous permet de tester et de participer concrètement à l'amélioration des intelligences artificielles en français. En quelques clics, vous contribuez à créer un bien commun numérique européen tout en comprenant mieux comment fonctionnent ces technologies.
Si vous travaillez en entreprise ou dans l'administration, la plateforme vous donne accès à un classement transparent et actualisé des modèles d'IA. Vous pouvez évaluer ces modèles sur vos propres cas d'usage et disposer de données pour éclairer le choix des bons outils.
Si vous êtes chercheur, vous accédez librement à des données de préférences humaines en français, précieuses pour mener des recherches sur l'évaluation des IA et collaborer avec d'autres équipes européennes.
Pour l'Europe dans son ensemble, Compar:IA contribue à notre souveraineté numérique en évitant de dépendre uniquement de données extra-européennes. Le projet préserve la diversité culturelle de nos langues et crée des ressources partagées et ouvertes, accessibles à tous.
Matrice d'impact
Voici comment on mesure l'impact de Compar:IA, en suivant une méthode progressive :
Utilisable → Utilisé → Utile → Impactant.
🎨 Est-ce que c'est facile a utiliser ?
91 modèles de langage testés depuis le lancement sur la plateforme
300 retours utilisateurs collectés via questionnaires
👥 Quelles sont les personnes qui l'utilisent ?
Usage en France
- 8 000-24 000 utilisateurs/mois (moyenne : 18 000)
- Plus de 500 000 questions posées
- 114 000 votes + 68 000 réactions
Partenariats éducatifs : PIX, Canopée, Café IA, CNNUM, CLEMI, UNESCO et plus de 1 000+ facilitateurs formés à l'atelier de sensibilisation "Duels de l'IA".
International : 3 pays répliquent la plateforme à l'international : 🇩🇰 Danemark, 🇸🇪 Suède, 🇱🇹 Lituanie. En 2026, le partenariat promet de s'accélérer grâce au portage européen d'un consortium, l'Alt-Edic.
♥️ Comment le service crée de la valeur ?
Données d'alignement
492 100 questions collectées, soit 24× supérieur à la référence mondiale pour le français. Le dataset international "lmsys-chat-1m" contient moins de 20 000 conversations en français (1,5% du total).
🎯 Quel est l'impact du produit sur les politiques publiques ?
Impact
- Plusieurs grands éditeurs de modèles se sont servis des jeux de données produits par Compar:IA (Cohere, Meta, Google Gemma, LiquidIA, HuggingFace)
- Les données produites sont réutilisées pour la recherche académique dans plusieurs domaines (sciences humaines etc...)
- Sensibilisation sur les biais des intelligences artificielles, via notamment les modules éducatifs proposée par Compar:IA ;
Risques évités :
- Dépendance culturelle : sans ressources francophones, nous serions totalement dépendants de données anglophones, souvent privées, pour nos IA.
- Fracture linguistique : les langues européennes moins parlées (comme le lituanien ou le danois) risquent d'être marginalisées par les technologies d'IA.
- Manque de transparence : en créant un classement public des modèles basé sur les préférences réelles des utilisateurs, on évite de dépendre uniquement des évaluations faites par les entreprises elles-mêmes.