We’re Still Waiting for the Next Big Leap in AI

Lorsque OpenAI a annoncé GPT-4, son dernier modèle de grande langue, en mars dernier, il a envoyé des ondes de choc dans le monde de la technologie. Il était clairement plus capable que tout ce qui a été vu avant de discuter, de coder et de résoudre toutes sortes de problèmes épineux, y compris les devoirs scolaires.

Anthropiqueun rival d'Openai, a annoncé aujourd'hui qu'il avait fait sa propre avance d'IA qui mettra à niveau les chatbots et autres cas d'utilisation. Mais bien que le nouveau modèle soit le meilleur du monde par certaines mesures, c'est plus un pas en avant qu'un grand saut.

Le nouveau modèle d'Anthropic, appelé Claude 3.5 Sonnet, est une mise à niveau de sa famille Claude 3 existante de modèles d'IA. Il est plus apte à résoudre les problèmes de mathématiques, de codage et de logique mesurés par des repères couramment utilisés. Anthropic dit qu'il est aussi beaucoup plus rapide, comprend mieux les nuances dans le langage et a même un meilleur sens de l'humour.

Cela est sans aucun doute utile aux personnes qui essaient de créer des applications et des services en plus des modèles d'IA d'Anthropic. Mais les nouvelles de l'entreprise sont également un rappel que le monde attend toujours un autre bond en avant dans l'IA semblable à celui livré par GPT-4.

L'attente est en train de se développer pour Openai pour publier une suite appelée GPT-5 depuis plus d'un an maintenant, et le PDG de la société, Sam Altman, a spéculation encouragée qu'il fournira une autre révolution dans les capacités de l'IA. Le GPT-4 coûte plus de 100 millions de dollars pour s'entraîner, et GPT-5 devrait être largement plus grand et plus cher.

Bien que Openai, Google et d'autres développeurs d'IA aient publié de nouveaux modèles qui dépassent le GPT-4, le monde attend toujours ce prochain grand saut. Les progrès dans l'IA sont devenus récemment plus progressifs et plus dépendants des innovations dans la conception et la formation du modèle plutôt que la mise à l'échelle brute de la taille du modèle et du calcul, comme GPT-4 l'a fait.

Michael Gerstenhaber, responsable du produit chez Anthropic, a déclaré que le nouveau modèle de sonnet Claude 3.5 de la société est plus grand que son prédécesseur mais tire une grande partie de sa nouvelle compétence des innovations en formation. Par exemple, le modèle a reçu des commentaires conçus pour améliorer ses compétences de raisonnement logique.

Anthropic dit que Claude 3.5 Sonnet dépasse les meilleurs modèles d'Openai, Google et Facebook dans des repères d'IA populaires, notamment Gpquun test d'expertise au niveau des diplômés en biologie, physique et chimie; MMLUun test couvrant l'informatique, l'histoire et d'autres sujets; et Humainune mesure de la maîtrise du codage. Les améliorations sont cependant une question de quelques points de pourcentage.

Ce dernier progrès dans l'IA n'est peut-être pas révolutionnaire mais il est rapide: anthropique uniquement annoncé sa génération précédente de modèles il y a trois mois. “Si vous regardez le taux de changement d'intelligence, vous apprécierez la vitesse à laquelle nous nous déplaçons”, explique Gerstenhaber.

Plus d'un an après que le GPT-4 a stimulé une frénésie de nouveaux investissements dans l'IA, il peut s'avérer plus difficile de produire de grands sauts dans l'intelligence machine. Avec GPT-4 et des modèles similaires formés sur d'énormes bandes de texte, d'images et de vidéos en ligne, il devient plus difficile de trouver de nouvelles sources de données à alimenter les algorithmes d'apprentissage automatique. Rendre les modèles sensiblement plus importants, ils ont donc plus de capacité à apprendre, devrait coûter des milliards de dollars. Lorsque OpenAI a annoncé sa propre mise à niveau récente le mois dernier, avec un modèle qui a des capacités vocales et visuelles appelées GPT-4O, l'accent était mis sur une interface plus naturelle et humaine plutôt que sur des capacités de résolution de problèmes beaucoup plus intelligentes.