OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills
OpenAI a annoncé aujourd'hui une version améliorée de son modèle d'intelligence artificielle le plus performant à ce jour – un modèle qui prend encore plus de temps pour délibérer sur les questions – juste un jour après que Google a annoncé son premier modèle de ce type.
Le nouveau modèle d'OpenAI, appelé o3, remplace o1, introduit par la société en septembre. Comme o1, le nouveau modèle passe du temps à réfléchir à un problème afin de fournir de meilleures réponses aux questions qui nécessitent un raisonnement logique étape par étape. (OpenAI a choisi d'ignorer le surnom « o2 » car il s'agit déjà du nom d'un opérateur de téléphonie mobile au Royaume-Uni.)
“Nous considérons cela comme le début de la prochaine phase de l'IA”, a déclaré vendredi Sam Altman, PDG d'OpenAI, lors d'une diffusion en direct. “Où vous pouvez utiliser ces modèles pour effectuer des tâches de plus en plus complexes qui nécessitent beaucoup de raisonnement.”
Selon OpenAI, le modèle o3 obtient des résultats beaucoup plus élevés sur plusieurs mesures que son prédécesseur, y compris celles qui mesurent les compétences complexes liées au codage et les compétences avancées en mathématiques et en sciences. C'est trois fois mieux que o1 pour répondre aux questions posées par ARC-AGIun benchmark conçu pour tester la capacité d'un modèle d'IA à raisonner sur des problèmes mathématiques et logiques extrêmement difficiles qu'il rencontre pour la première fois.
Google poursuit une ligne de recherche similaire. Noam Shazeer, chercheur chez Google, hier révélé dans un post sur X que l'entreprise a développé son propre modèle de raisonnement, appelé Gemini 2.0 Flash Thinking. Le PDG de Google, Sundar Pichai, l'a qualifié de « notre modèle le plus réfléchi à ce jour » dans son propre poste. Le nouveau modèle de Google a obtenu un score élevé au SWE-Bench, un test qui mesure les capacités agents d'un modèle.
Cependant, le nouveau modèle o3 d'OpenAI est 20 % meilleur que o1. “o3 l'a fait sortir de l'eau”, dit À propos de la pressechercheur postdoctoral à l'Université de Princeton qui a contribué au développement de SWE-Bench. “Augmentation très surprenante, je ne sais pas comment ils y sont parvenus.”
Les deux modèles de duel montrent que la concurrence entre OpenAI et Google est plus féroce que jamais. Il est crucial pour OpenAI de démontrer qu’elle peut continuer à progresser alors qu’elle cherche à attirer davantage d’investissements et à bâtir une entreprise rentable. Google cherche quant à lui désespérément à montrer qu’il reste à la pointe de la recherche sur l’IA.
Les nouveaux modèles montrent également comment les entreprises d’IA regardent de plus en plus au-delà de la simple mise à l’échelle des modèles d’IA afin d’en tirer une plus grande intelligence.
OpenAI indique qu'il existe deux versions du nouveau modèle, o3 et o3-mini. La société ne rend pas encore les modèles accessibles au public, mais annonce qu'elle invitera des personnes extérieures à postuler pour les tester.
OpenAI a également révélé aujourd'hui plus de détails sur les techniques utilisées pour aligner o1. La nouvelle méthode, connue sous le nom d'alignement délibératif, consiste à former un modèle avec un ensemble de spécifications de sécurité et à le faire raisonner sur la nature de la demande ainsi que sur la réponse qui lui est donnée pour savoir s'il peut enfreindre ses garde-corps. Cette approche rend le modèle plus difficile à inciter à un mauvais comportement, car son processus de raisonnement peut éliminer les tentatives de méfait.