Inside Google’s 7-Year Mission to Give AI a Robot Body
Souvent pendant les soirées et parfois les week-ends, alors que les robots n'étaient pas occupés à faire leurs tâches quotidiennes, Catie et son équipe impromptue réunissaient une douzaine de robots dans un grand atrium au milieu de X. des troupeaux de robots ont commencé à bouger ensemble, parfois De manière de façon inédite, mais toujours dans des modèles intéressants, avec ce qui ressemblait souvent à la curiosité et parfois même à la grâce et à la beauté. Tom Engbersen est un robotique des Pays-Bas qui a peint des répliques de chefs-d'œuvre classiques pendant son temps libre. Il a commencé un projet parallèle collaborant avec Catie sur une exploration de la façon dont les robots dansants pourraient répondre à la musique ou même jouer un instrument. À un moment donné, il avait une idée nouvelle: que se passe-t-il si les robots devenaient eux-mêmes des instruments? Cela a lancé une exploration où chaque joint du robot a joué un son lorsqu'il a bougé. Lorsque la base se déplaçait, elle a joué un son de basse; Lorsqu'une pince s'est ouverte et fermée, elle a fait une cloche. Lorsque nous avons allumé le mode musical, les robots ont créé des scores orchestraux uniques à chaque fois qu'ils se déplaçaient. Qu'ils voyageaient dans un couloir, trie des ordures, des tables de nettoyage ou de la «danse» comme un troupeau, les robots se sont déplacés et ressemblaient à un nouveau type de créature accessible, contrairement à tout ce que j'ai jamais connu.
Ce n'est que le début
Fin 2022, les conversations de bout en bout contre hybrides étaient toujours solides. Peter et ses coéquipiers, avec nos collègues de Google Brain, avaient travaillé à appliquer l'apprentissage du renforcement, l'apprentissage de l'imitation et les transformateurs – l'architecture derrière les LLM – à plusieurs tâches de robot. Ils faisaient de bons progrès en montrant que les robots pouvaient apprendre des tâches d'une manière qui les rendait généraux, robustes et résilients. Pendant ce temps, l'équipe des applications dirigée par Benjie travaillait à prendre des modèles d'IA et à les utiliser avec la programmation traditionnelle pour prototyper et créer des services de robot qui pourraient être déployés parmi les personnes dans des paramètres du monde réel.
Pendant ce temps, Project Starling, alors que l'installation multi-robot de Catie a fini par être appelé, changeait ce que je ressentais à propos de ces machines. J'ai remarqué comment les gens étaient attirés par les robots avec émerveillement, joie et curiosité. Cela m'a aidé à comprendre que comment Les robots se déplacent parmi nous, et à quoi ils ressemblent, déclencheront une émotion humaine profonde; Ce sera un facteur important dans la façon dont, même si, nous les accueillons dans notre vie quotidienne.
En d'autres termes, nous étions sur le point de capitaliser vraiment sur le plus gros pari que nous avions fait: des robots propulsés par l'IA. L'IA leur donnait la capacité de comprendre ce qu'ils ont entendu (langue parlée et écrite) et traduire en actions, ou comprendre ce qu'ils ont vu (images de la caméra) et traduire cela en scènes et objets sur lesquels ils pourraient agir. Et comme l'équipe de Peter l'avait démontré, les robots avaient savant pour ramasser des objets. Après plus de sept ans, nous déployions des flottes de robots sur plusieurs bâtiments Google. Un seul type de robot effectuait une gamme de services: essuyer de manière autonome les tables dans les cafétérias, inspecter les salles de conférence, trier les ordures, etc.
C'est alors que, en janvier 2023, deux mois après que OpenAI ait introduit Chatgpt, Google a fermé les robots de tous les jours, citant des problèmes de coût globaux. Les robots et un petit nombre de personnes ont finalement atterri à Google Deepmind pour mener des recherches. Malgré le coût élevé et la longue chronologie, toutes les personnes impliquées ont été choquées.
Un impératif national
En 1970, pour chaque personne de plus de 64 ans dans le monde, il y avait 10 personnes d'âge de travail. D'ici 2050, il y en aura probablement moins de quatre. Nous manquons de travailleurs. Qui s'occupera des personnes âgées? Qui travaillera dans les usines, les hôpitaux, les restaurants? Qui conduira des camions et des taxis? Des pays comme le Japon, la Chine et la Corée du Sud comprennent l'immédiateté de ce problème. Là, les robots ne sont pas facultatifs. Ces nations en ont fait un impératif national d'investir dans les technologies robotiques.
Donner à l'IA un corps dans le monde réel est à la fois un problème de sécurité nationale et une énorme opportunité économique. Si une entreprise technologique comme Google décide qu'elle ne peut pas investir dans des efforts de «Moonshot» comme les robots alimentés par l'IA qui compléteront et compléteront les travailleurs du futur, alors qui le fera? La Silicon Valley ou d'autres écosystèmes de démarrage intensifieront-ils, et si oui, y aura-t-il un accès à un capital patient à long terme? J'ai des doutes. La raison pour laquelle nous avons appelé les robots de tous les jours comme un morshot est que la construction de systèmes très complexes à cette échelle est allé bien au-delà de ce que les startups financées par le capital-capital ont historiquement eu la patience. Alors que les États-Unis sont en avance dans l'IA, en construisant la manifestation physique de celui-ci – Robots – requise les compétences et les infrastructures où d'autres nations, notamment la Chine, sont déjà en tête.
Les robots ne se sont pas présentés à temps pour aider ma mère. Elle est décédée au début de 2021. Nos conversations fréquentes vers la fin de sa vie m'ont convaincu plus que jamais qu'une future version de ce que nous avons commencé chez les robots de tous les jours arrivera. En fait, cela ne peut pas venir assez tôt. Donc, la question à laquelle nous devons réfléchir devient: comment ce genre de changement et d'avenir se produit-il? Je reste curieux et inquiet.
Faites-nous savoir ce que vous pensez de cet article. Soumettre une lettre à l'éditeur à [email protected].