Robots humanoïdes et leurs dernières avancées

25 sept. 2024
Les compétences acquises dans les simulations sont transférées au robot humanoïde avec Sim2Real (Photo : Unitree)

DOSSIER LOGISTIQUE
Jay Huang, Ph.D, Dien Wang, Ph.D et Weibin Liang, Ph.D

Photo : Unitree

Les robots humanoïdes, cette forme d’automate dont l’humanité rêve depuis longtemps, semblent enfin devenir une réalité. La présentation d’Optimus a suscité un engouement sans précédent tant auprès du grand public que des géants technologiques, même si l’industrie en est encore au stade du prototype.

Inspirés par l’anatomie humaine, les trois éléments principaux des humanoïdes sont le « cerveau », dédié à la planification des tâches et des déplacements, le « cervelet », qui assure l’équilibre et la fluidité des mouvements, et le « corps », qui confère perception et capacité d’action. Les principaux défis à relever concernent la prévention des chutes et l’amélioration de leur intelligence pour accomplir diverses missions.

L’intelligence artificielle (IA) a bouleversé les règles du jeu. Des techniques émergentes comme l’apprentissage par renforcement, par imitation ou les grands modèles de langages (LLM) ouvrent de nouvelles perspectives prometteuses pour les robots humanoïdes. Grâce à leur « cervelet », ces robots peuvent maintenir leur équilibre, éviter les obstacles, exécuter des mouvements complexes dans des environnements virtuels et transférer ces compétences dans le monde réel. Les « cervelets » améliorés par l’IA montrent des progrès remarquables en termes de stabilité et d’adaptabilité des robots, des défis majeurs par le passé. Si cette région du cerveau est essentielle, le « cerveau » des humanoïdes revêt une importance encore plus grande. L’apprentissage par renforcement et par imitation sont très prometteurs pour des applications entraînées à court terme. L’utilisation de grands modèles de langage est attrayante, mais leur implémentation pratique reste complexe en pratique. La téléopération, où un robot distant est contrôlé par un opérateur humain, excelle dans la collecte de données d’entraînement et peut servir de solutions de secours si les « cerveaux » robotiques ne sont pas suffisamment performants à moyen terme.

Avant l’intégration de l’IA dans ce domaine, les androïdes étaient sujets aux chutes

En ce qui concerne les entreprises développant des humanoïdes et leurs dernières avancées, Unitree se distingue dans le domaine du « corps » et du « cervelet ». Bien qu’initialement spécialisée dans les robots quadrupèdes, l’entreprise s’est tournée vers la bipédie et son humanoïde présente une mobilité exceptionnelle. D’autre part, Google DeepMind a progressé dans le développement du « cerveau » robotique. L’entreprise explore l'IA générative (GenIA) et d’autres techniques au-delà des grands modèles traditionnels, et ses recherches s’appuient sur des humanoïdes simplifiés.

Les trois éléments cruciaux pour les humanoïdes sont le « cerveau », le « cervelet » et le « corps », y compris leurs « yeux », « oreilles », « peau », « muscles » et « os ». Il est important de noter que les principaux axes d’amélioration de ces trois éléments sont relativement indépendants et peuvent être perfectionnés en parallèle.

Les humanoïdes doivent encore améliorer leur stabilité avant d'être utilisés en conditions réelles (Photo : Unitree)
Photo : Unitree

Le « cervelet »

Tout comme chez les humains, le « cervelet » d’un humanoïde joue un rôle primordial dans la coordination articulaire, assurant ainsi son équilibre et la fluidité de ses mouvements.

La marche stable des robots a longtemps été un défi majeur. Avant l’intégration de l’IA dans ce domaine, les androïdes étaient sujets aux chutes, nécessitant même l’utilisation de câbles de sécurité pour protéger les machines les plus fragiles. Bien que certaines entreprises aient mis en œuvre des méthodes de contrôle relativement avancées, telles que le contrôle total du corps et le contrôle prédictif par modèle (CPM) avec des résultats impressionnants, les humanoïdes restent incapables de réagir efficacement dans des scénarios imprévisibles. Ils requièrent une optimisation plus poussée de leur locomotion ou pour exécuter des tâches spécifiques, et le « cervelet » présente encore des obstacles dans ce domaine.

Heureusement, l’IA, notamment l’apprentissage par renforcement et les puissantes techniques de simulation actuelles peuvent changer la donne. L’apprentissage par renforcement est un processus d’essais et d’erreurs où les robots acquièrent des comportements en interagissant de manière répétée avec leur environnement. Les ingénieurs programment les humanoïdes avec des objectifs (« quoi faire »), mais ne leur indiquent pas les moyens (« comment faire »), laissant ainsi les automates trouver eux-mêmes les solutions.

La vision 3D utilisant le LiDAR ou les caméras de profondeur, les mains agiles et les capteurs tactiles/de pression sont primordiales pour les performances humanoïdes

Pour perfectionner ces mouvements, il est nécessaire d’utiliser des simulations, c’est-à-dire des environnements virtuels dans lesquels les robots peuvent améliorer leur locomotion et l’exécution de tâches. Les compétences et connaissances acquises en simulation virtuelle peuvent ensuite être transférées à la réalité grâce à des infrastructures appelées Sim2real. Les échecs sont inévitables dans les premières phases, mais les robots finissent par trouver le moyen de surmonter ces difficultés.

Bien que l’avenir semble prometteur, les environnements de simulation et la technologie Sim2Real posent également certains défis. Ce sont des plateformes complexes qui reproduisent des phénomènes physiques, ce qui implique de gérer des aspects tels que la dynamique des corps rigides, les collisions, les frottements et les déformations afin de créer des mondes virtuels aussi réalistes que possible.

Boston Dynamics a réussi à réduire la fréquence de chute de son robot quadrupède à une fois tous les 50 kilomètres. Ce chiffre est plus élevé pour les bipèdes, ce qui signifie que malgré les progrès réalisés, les humanoïdes ont encore besoin d’une stabilité accrue avant de pouvoir être déployés à grande échelle dans l’industrie.

Robot humanoïde Optimus Gen-2 de Tesla (publié sous licence CC BY 3.0 Unported)
Robot humanoïde Optimus Gen-2 de Tesla
Publié sous licence CC BY 3.0 Unported

Le “cerveau”

Les chercheurs explorent encore les moyens de rendre les robots suffisamment intelligents pour accomplir diverses tâches. À court terme, le problème est abordé grâce à l’apprentissage par renforcement et par imitation, tandis que l’on envisage d’implémenter des grands modèles de langage et des modèles end-to-end à plus long terme.

En plus d’améliorer les mouvements des robots, l’apprentissage par renforcement est utile pour les entraîner à des tâches spécifiques. Cependant, l’utiliser pour atteindre une autonomie plus générale dans des actions complexes peut s’avérer trop long. C’est pourquoi l’apprentissage par imitation, où une personne montre au robot comment agir via des systèmes de téléopération, est une approche plus pratique.

L’équipe de Google DeepMind a proposé d’utiliser de multiples grands modèles pour gérer les fonctions de perception, de planification et d’exécution. Pour ce faire, il introduit un modèle intégré de vision-langage-action (VLA) appelé Robotic Transformer 2 (RT-2) afin de traiter ces trois fonctions principales. Ils ont démontré que RT2 peut accomplir des tâches demandant du raisonnement, de la compréhension de symbole et de la reconnaissance, des capacités typiquement humaines. Par exemple, la directive : « mets la fraise dans le bon bol » exige que le robot comprenne la différence entre un bol et une coupelle, mais aussi qu’il soit capable de grouper ce fruit avec d’autres similaires.

Le “corps”

Au-delà des composants principaux, tels que les moteurs et les freins, nous considérons que les éléments comme la vision artificielle 3D, grâce à des scanners LiDAR ou des caméras de profondeur, des mains agiles et des capteurs tactiles et de pression, sont déterminants pour les performances humanoïdes. C’est pourquoi, nous pensons qu’ils seront indispensables pour réaliser des robots avancés dotés d’une fonctionnalité optimale.

Tendances émergentes et défis des robots humanoïdes

Principaux modules des robots humanoïdes Tendances technologiques Défis
“Cerveau”
Planification des tâches et des mouvements
  • Présent : apprentissage par renforcement + apprentissage par imitation
  • Futur : grands modèles de langages (LLM)
  • Futur à long terme : grands modèles end-to-end
  • Manque de données d’entraînement
  • Incapacité à accomplir certaines tâches
  • Fiabilité à vérifier
“Cervelet”
Coordination des articulations
  • Passé : contrôle total du corps + contrôle prédictif par modèle (CPM)
  • Présent : apprentissage par renforcement + Sim2Real*
  • Qualité du transfert de la simulation au monde réel
  • Adaptabilité à différents environnements
“Corps”
Perception de l’environnement et exécution du mouvement
  • Moteurs à haute densité de puissance
  • Mains robotiques flexibles
  • Capteurs tactiles de pression
  • Diminution des coûts
  • Amélioration des performances du matériel (haute densité de puissance, dynamique, réduction du poids, etc.)

 

Sources : Académie chinoise des Sciences, Centre d'innovation de robots humanoïdes de Pékin, Université Tsinghua et analyse de Bernstein.
*Sim2Real, abréviation de "simulation de la réalité", désigne le transfert de mouvements, de compétences ou de connaissances d'une simulation virtuelle vers le monde réel.

Implications dans l’industrie

Dans cette ère de « renaissance des robots », l’IA est souvent intégrée pour des tâches de localisation, d’identification et d’inspection, mais les robots industriels manquent encore d’intelligence avancée. Les technologies émergentes comme l’apprentissage par renforcement, par imitation ou les grands modèles de langage peuvent révolutionner ce domaine.

Les scientifiques ont déjà démontré la faisabilité d’utiliser conjointement des robots et de l’intelligence artificielle pour optimiser leurs trajectoires et leurs temps d’exécution, générer des stratégies pour évoluer dans des environnements complexes et simplifier les processus de programmation. Avec un écosystème de robots industriels déjà bien établi, nous espérons que l’IA en accélérera l’adoption dans un avenir proche.

 


 

AUTEURS DE LA RECHERCHE :

Jay Huang, Ph.D, Dien Wang, Ph.D et Weibin Liang, Ph.D, analystes de recherche chez Sanford C. Bernstein (Hong Kong) Limited, une filiale du groupe Société Générale.

 


 

Publication originale :

Huang, Jay, Wang, Dien, Liang, Weibin. 2024. “Global Automation: The Humanoid Primer”. Bernstein Société Générale Group.

Veuillez noter que ce document a été conçu à l'intention exclusive des investisseurs institutionnels et professionnels et ne s'adresse pas aux investisseurs particuliers. Pour toute information complémentaire, veuillez consulter le site www.bernsteinresearch.com.