Gemini Deep Think Olympiades mathématiques

Gemini Deep Think remporte l’or aux Olympiades Internationales de Mathématiques

7 minutes de lecture
Gemini Deep Think Olympiades mathématiques

Pour la première fois, une intelligence artificielle a atteint le niveau d’une médaille d’or aux Olympiades Internationales de Mathématiques (IMO), une compétition prestigieuse réservée aux esprits mathématiques les plus brillants. L’IA Gemini Deep Think de Google DeepMind a résolu cinq des six problèmes proposés, obtenant un score de 35 points sur 42, suffisant pour décrocher l’or. Cet exploit marque une avancée majeure dans les capacités de raisonnement des modèles d’intelligence artificielle, avec des implications prometteuses pour la recherche scientifique.


Une performance historique à l’IMO

Les Olympiades Internationales de Mathématiques, organisées chaque année depuis 1959, réunissent les meilleurs lycéens mathématiciens du monde. Les participants, représentant plus de 100 pays, doivent résoudre six problèmes complexes en deux sessions de 4,5 heures, couvrant des disciplines comme l’algèbre, la combinatoire, la géométrie et la théorie des nombres. Seuls 8 % des compétiteurs humains obtiennent une médaille d’or, rendant l’exploit de Gemini Deep Think d’autant plus remarquable.

En 2024, Google DeepMind avait déjà impressionné en obtenant une médaille d’argent avec ses modèles AlphaProof et AlphaGeometry 2, résolvant quatre des six problèmes. Cependant, ces systèmes nécessitaient une traduction humaine des énoncés en un langage formel, et leur résolution prenait jusqu’à trois jours. En 2025, Gemini Deep Think a franchi un cap en travaillant directement en langage naturel, sans intervention humaine, et en respectant la limite de temps de 4,5 heures imposée aux compétiteurs humains. Cette performance a été officiellement validée par les coordinateurs de l’IMO, qui ont qualifié les solutions de l’IA de « claires, précises et faciles à suivre ».


Comment fonctionne Gemini Deep Think ?

Contrairement aux modèles précédents, qui s’appuyaient sur des langages formels comme Lean, Gemini Deep Think utilise une approche innovante appelée « pensée parallèle ». Cette technique permet à l’IA d’explorer simultanément plusieurs chemins de raisonnement, d’intégrer les résultats et de produire une réponse finale rigoureuse. Selon Thang Luong, scientifique senior chez DeepMind, cette méthode marque un changement de paradigme par rapport aux approches traditionnelles basées sur l’apprentissage par renforcement avec des réponses finales vérifiables.

De plus, Gemini Deep Think a été entraîné sur un ensemble de données mathématiques de haute qualité, incluant des milliers de preuves d’Olympiades soigneusement sélectionnées. Cette formation, combinée à des stratégies d’apprentissage par renforcement pour le raisonnement multi-étapes, permet à l’IA de produire des preuves complètes et élégantes, souvent plus simples que celles des compétiteurs humains. Par exemple, pour un problème de théorie des nombres, l’IA a utilisé des concepts élémentaires là où de nombreux participants humains ont eu recours à des théorèmes avancés comme celui de Dirichlet.


Une erreur révélatrice

Malgré son succès, Gemini Deep Think n’a pas obtenu un score parfait. Le seul problème non résolu, considéré comme le plus difficile de la compétition, portait sur le nombre minimum de rectangles nécessaires pour couvrir un espace donné. Selon Junehyuk Jung, chercheur chez DeepMind, l’IA a démarré avec une hypothèse erronée, supposant que la réponse était supérieure ou égale à 10, ce qui l’a menée à une impasse. Seuls cinq compétiteurs humains ont résolu ce problème, soulignant sa complexité.

Cette erreur illustre une limite actuelle des modèles d’IA : bien qu’ils excellent dans le raisonnement structuré, ils peuvent encore être piégés par des hypothèses initiales incorrectes. Cependant, la capacité de Gemini Deep Think à produire des preuves claires et vérifiables, même pour des problèmes complexes, témoigne de son potentiel.


Implications pour la recherche et au-delà

La performance de Gemini Deep Think va au-delà d’une simple victoire compétitive. Elle démontre que les modèles d’intelligence artificielle peuvent désormais rivaliser avec les meilleurs esprits humains dans des tâches nécessitant un raisonnement créatif et abstrait. Pour les mathématiciens, cette avancée ouvre la voie à des outils d’IA capables d’explorer des hypothèses, de tester des approches audacieuses et d’accélérer la résolution de conjectures complexes.

En outre, cette technologie pourrait transformer d’autres domaines scientifiques, comme la physique, la chimie ou l’ingénierie, où des calculs complexes et des raisonnements multi-étapes sont nécessaires. Google prévoit de déployer une version de Gemini Deep Think auprès de mathématiciens et de chercheurs avant une disponibilité plus large pour les abonnés Google AI Ultra.


Une controverse avec OpenAI

L’annonce de Google a été précédée par une déclaration d’OpenAI, qui a revendiqué une performance similaire sans participer officiellement à l’IMO. Cette annonce prématurée, évaluée par d’anciens médaillés de l’IMO plutôt que par les organisateurs officiels, a suscité des critiques pour avoir enfreint l’embargo demandé par le comité de l’IMO. En revanche, Google DeepMind a attendu la validation officielle, une démarche saluée par la communauté pour son respect des règles et des compétiteurs humains.


Vers une collaboration entre IA et mathématiciens

Cette percée marque un tournant dans l’utilisation des modèles d’intelligence artificielle pour le raisonnement mathématique. En combinant la fluidité du langage naturel avec la rigueur des preuves formelles, Gemini Deep Think montre que l’IA peut devenir un partenaire précieux pour les chercheurs. Cependant, comme l’a souligné DeepMind, ce n’est qu’un début. L’objectif à long terme est de développer des systèmes capables de résoudre des problèmes mathématiques encore plus complexes, voire de découvrir de nouvelles connaissances.

En conclusion, la médaille d’or de Gemini Deep Think aux Olympiades Internationales de Mathématiques illustre le potentiel croissant des IA à rivaliser avec les humains dans des domaines intellectuels exigeants. Cette avancée, soutenue par des techniques innovantes comme la pensée parallèle, ouvre des perspectives excitantes pour la recherche scientifique. Toutefois, elle rappelle aussi la nécessité d’une collaboration étroite entre l’IA et les experts humains pour maximiser son impact.


Sources :
https://arstechnica.com/ai/2025/07/google-deepmind-earns-gold-in-international-math-olympiad-with-new-gemini-ai/

Partager cet article
Aucun commentaire