Liquid AI Is Redesigning the Neural Network

Intelligence artificielle Il est peut-être désormais possible de résoudre des mathématiques avancées, d'effectuer des raisonnements complexes et même d'utiliser des ordinateurs personnels, mais les algorithmes d'aujourd'hui pourraient encore apprendre une ou deux choses à partir de vers microscopiques.

IA liquideune startup issue du MIT, dévoilera aujourd'hui plusieurs nouveaux modèles d'IA basés sur un nouveau type de réseau neuronal « liquide » qui a le potentiel d'être plus efficace, moins gourmand en énergie et plus transparent que ceux qui sous-tendent tout, de des chatbots aux générateurs d'images en passant par les systèmes de reconnaissance faciale.

Les nouveaux modèles de Liquid AI incluent un pour détecter la fraude dans les transactions financières, un autre pour contrôler les voitures autonomes et un troisième pour analyser les données génétiques. La société a vanté les nouveaux modèles, qu'elle octroie sous licence à des sociétés extérieures, lors d'un événement organisé aujourd'hui au MIT. La société a reçu un financement d'investisseurs parmi lesquels Samsung et Shopify, qui testent également sa technologie.

«Nous intensifions nos activités», déclare Ramin Hasanicofondateur et PDG de Liquid AI, qui a co-inventé les réseaux liquides en tant qu'étudiant diplômé au MIT. Les recherches de Hasani se sont inspirées du C. elegansun ver d'un millimètre de long que l'on trouve généralement dans le sol ou dans la végétation en décomposition. Le ver est l’une des rares créatures dont l’intégralité du système nerveux a été cartographiée et il est capable d’un comportement remarquablement complexe malgré quelques centaines de neurones. «Auparavant, ce n'était qu'un projet scientifique, mais cette technologie est entièrement commercialisée et prête à apporter de la valeur aux entreprises», explique Hasani.

À l’intérieur d’un réseau neuronal régulier, les propriétés de chaque neurone simulé sont définies par une valeur statique ou « poids » qui affecte son déclenchement. Dans un réseau neuronal liquidele comportement de chaque neurone est régi par une équation qui prédit son comportement au fil du temps, et le réseau résout une cascade d'équations liées au fur et à mesure que le réseau fonctionne. La conception rend le réseau plus efficace et plus flexible, lui permettant d'apprendre même après une formation, contrairement à un réseau neuronal conventionnel. Les réseaux de neurones liquides sont également ouverts à l’inspection, contrairement aux modèles existants, car leur comportement peut essentiellement être rembobiné pour voir comment ils ont produit un résultat.

En 2020, les chercheurs ont montré qu’un tel réseau avec seulement 19 neurones et 253 synapses, ce qui est remarquablement petit par rapport aux normes modernes, pourrait contrôler une voiture autonome simulée. Alors qu’un réseau neuronal classique ne peut analyser les données visuelles qu’à intervalles statiques, le réseau liquide capture très efficacement la manière dont les informations visuelles évoluent au fil du temps. En 2022, les fondateurs de Liquid AI j'ai trouvé un raccourci cela a rendu le travail mathématique nécessaire aux réseaux de neurones liquides réalisable pour une utilisation pratique.

Liquid AI affirme s'être appuyé sur ces travaux et avoir inventé de nouveaux modèles qu'il garde secrets pour l'instant. En septembre, l'entreprise a révélé quelques grands modèles de langage en fonction de la conception de son réseau. Une version de son modèle de langage avec 40 milliards de paramètres a surpassé la version de 70 milliards de paramètres de Meta's Llama 3.1 sur un ensemble commun de problèmes connus sous le nom de MMLU-Prodit la startup.

“Les résultats de référence pour leurs SLM semblent très prometteurs”, déclare Sébastien Bubeckchercheur chez OpenAI qui explore comment l'architecture et la formation des modèles d'IA affectent leurs capacités.

« Trouver un nouveau type de modèle de base n'arrive pas tous les jours », déclare Tom Preston-Werner, cofondateur de GitHub et l'un des premiers investisseurs dans Liquid AI, qui note que les modèles de transformateur qui sous-tendent les grands modèles de langage et d'autres systèmes d'IA sont commencent à montrer leurs limites. Preston-Werner ajoute que rendre l’IA plus efficace devrait être une grande priorité pour tout le monde. « Nous devrions faire tout ce que nous pouvons pour être sûrs de ne pas faire fonctionner des centrales au charbon plus longtemps », dit-il.

L'un des inconvénients de l'approche de Liquid AI est que ses réseaux sont particulièrement adaptés à certaines tâches, notamment celles qui impliquent des données temporelles. Faire fonctionner la technologie avec d’autres types de données nécessite un code personnalisé. Et bien sûr, un autre défi sera de convaincre les grandes entreprises de fonder leurs projets importants sur une toute nouvelle conception de l’IA.

Hasani affirme que l'objectif est désormais de démontrer que les avantages, notamment l'efficacité, la transparence et les coûts énergétiques, l'emportent sur les défis. « Nous arrivons à des stades où ces modèles peuvent atténuer une grande partie des défis socio-techniques des systèmes d’IA », dit-il.