Compar:IA

Démocratiser l'accès aux modèles d'IA conversationnelle pour les français et
françaises et constituer un commun numérique européen.

Publié le lundi 8 décembre 2025 | Accélération

Utilisable

91 modèles
testés depuis le lancement

Utilisé

8 000-24 000 UUID/mois
Plus de 114 000 votes
Plus de 500 000 questions en cumulé.

Utile

492 100 questions collectées
(Valeur d'alignement)

Impactant

Sensibilise et favorise la recherche et le développement de modèles en langues européennes.

Contexte et enjeux

Imaginez que vous appreniez à parler le français en lisant principalement des livres en anglais, et une toute petite proportion de livres en français. Vous parlerez français, mais avec des tournures bizarres, des références culturelles décalées, et des erreurs de compréhension. C'est exactement le problème des intelligences artificielles actuelles avec de nombreuses langues européennes. Les grands modèles de langage (LLM) actuels sont entraînés sur des données essentiellement anglo-saxonnes, créant des biais linguistiques et culturels.

D'autre part, l'évaluation humaine des modèles sur des tâches en français reste coûteuse et complexe : les corpus d'évaluation existants sont également majoritairement en anglais et ne reflètent pas forcement nos usages francophones.

Face à ce constat, le Ministère de la Culture a développé Compar:IA, une plateforme publique permettant de tester et comparer des modèles d'IA conversationnelle en français tout en constituant un commun numérique pour l'écosystème.

Comment ça fonctionne ?

Compar:IA fonctionne selon le principe suivant :

  • Comparaison à l'aveugle : l'utilisateur soumet une question à deux modèles anonymes parmi plus de 20 modèles
  • Expression de préférence : l'utilisateur choisit la meilleure réponse
  • Révélation et information : l'identité des modèles est dévoilée avec leurs caractéristiques (nom, taille, impact environnemental, etc.)
  • Constitution d'un commun : les questions et préférences alimentent des jeux de données open source.

Et surtout : toutes ces questions et préférences sont partagées en open source pour aider à améliorer les IA pour tout le monde.

  • IA frugale

  • Superscale

À propos

Informations clés

  • Porteur : L'Atelier Numérique du Ministère de la Culture
  • Sponsors : DINUM, Ministère de la Culture
  • Phase : Accélération (depuis avril 2025), lancé en janvier 2024

Accès

Quel impact pour moi ?

Si vous êtes citoyen, Compar:IA vous permet de tester et de participer concrètement à l'amélioration des intelligences artificielles en français. En quelques clics, vous contribuez à créer un bien commun numérique européen tout en comprenant mieux comment fonctionnent ces technologies.

Si vous travaillez en entreprise ou dans l'administration, la plateforme vous donne accès à un classement transparent et actualisé des modèles d'IA. Vous pouvez évaluer ces modèles sur vos propres cas d'usage et disposer de données pour éclairer le choix des bons outils.

Si vous êtes chercheur, vous accédez librement à des données de préférences humaines en français, précieuses pour mener des recherches sur l'évaluation des IA et collaborer avec d'autres équipes européennes.

Pour l'Europe dans son ensemble, Compar:IA contribue à notre souveraineté numérique en évitant de dépendre uniquement de données extra-européennes. Le projet préserve la diversité culturelle de nos langues et crée des ressources partagées et ouvertes, accessibles à tous.

Matrice d'impact

Voici comment on mesure l'impact de Compar:IA, en suivant une méthode progressive :

Utilisable → Utilisé → Utile → Impactant.

🎨 Est-ce que c'est facile a utiliser ?

91 modèles de langage testés
depuis le lancement sur la plateforme
300 retours utilisateurs collectés via questionnaires

👥 Quelles sont les personnes qui l'utilisent ?

Usage en France
- 8 000-24 000 utilisateurs/mois (moyenne : 18 000)
- Plus de 500 000 questions posées
- 114 000 votes + 68 000 réactions

Partenariats éducatifs : PIX, Canopée, Café IA, CNNUM, CLEMI, UNESCO et plus de 1 000+ facilitateurs formés à l'atelier de sensibilisation "Duels de l'IA".
International : 3 pays répliquent la plateforme à l'international : 🇩🇰 Danemark, 🇸🇪 Suède, 🇱🇹 Lituanie. En 2026, le partenariat promet de s'accélérer grâce au portage européen d'un consortium, l'Alt-Edic.

~1,10 € par utilisateur actif/mois par utilisateur actif en décembre 2025
Calcul : 19 800 €/mois ÷ 18 000 utilisateurs

♥️ Comment le service crée de la valeur ?

Données d'alignement
492 100 questions collectées, soit 24× supérieur à la référence mondiale pour le français. Le dataset international "lmsys-chat-1m" contient moins de 20 000 conversations en français (1,5% du total).

~1,03 € par question collectée en décembre 2025
Calcul : 475 000 € ÷ 492 100 questions

🎯 Quel est l'impact du produit sur les politiques publiques ?

Impact
- Plusieurs grands éditeurs de modèles se sont servis des jeux de données produits par Compar:IA (Cohere, Meta, Google Gemma, LiquidIA, HuggingFace)
- Les données produites sont réutilisées pour la recherche académique dans plusieurs domaines (sciences humaines etc... [export Lucie])
- Sensibilisation sur les biais des intelligences artificielles, via notamment les modules éducatifs proposée par Compar:IA ;

Risques évités :
- Dépendance culturelle : sans ressources francophones, nous serions totalement dépendants de données anglophones, souvent privées, pour nos IA.
- Fracture linguistique : les langues européennes moins parlées (comme le lituanien ou le danois) risquent d'être marginalisées par les technologies d'IA.
- Manque de transparence : en créant un classement public des modèles basé sur les préférences réelles des utilisateurs, on évite de dépendre uniquement des évaluations faites par les entreprises elles-mêmes.


🔍 Annexe : Comment reproduire les calculs

Données nécessaires :

  • Budget total lissé sur deux ans : ~475 000 €
  • Durée : 24 mois
  • Utilisateurs actifs mensuels moyens : 18 000

Calcul :

Coût mensuel = Budget total ÷ Nombre de mois
Coût mensuel = 475 000 € ÷ 24 = 19 792 €

Coût par utilisateur = Coût mensuel ÷ Utilisateurs actifs
Coût par utilisateur = 19 792 € ÷ 18 000 = 1,10 €

Données nécessaires :

  • Budget total lissé sur deux ans : ~475 000 €
  • Durée : 24 mois
  • Utilisateurs actifs mensuels moyens : 18 000

Calcul:

Capture d’écran 2025-12-05 à 11.37.09

Données nécessaires :

  • Coût total du service : ~475 000 € (lissé sur deux ans)
  • Nombre total de questions collectées : 492 100

Calcul :

Coût par question = Coût total ÷ Nombre de questions
Coût par question = 475 000 € ÷ 492 100 = 0,97 €

(arrondi à 1,03 € dans le document original pour inclure d'autres frais)

Données nécessaires :

  • Dataset lmsys-chat-1m : ~1 000 000 de conversations
  • Part du français : 1,5%
  • Conversations en français : 1 000 000 × 1,5% = 15 000 conversations

Approximation : le document indique "moins de 20 000 conversations"

Dataset Compar:IA : 492 100 questions

Calcul du ratio :

Ratio = Questions Compar:IA ÷ Conversations lmsys en français
Ratio = 492 100 ÷ 20 000 = 24,6

→ Arrondi à "24 fois supérieur"

Note importante : Une "conversation" dans lmsys peut contenir plusieurs échanges, tandis qu'une "question" dans Compar:IA est un échange unique. Cette comparaison est donc approximative mais donne un ordre de grandeur.

IA générative