What if video game players were training the weapons of tomorrow?
What if video game players were training the weapons of tomorrow?For the past few months, one of my sons and I have often been playing the game ARC Raiders. To summarize it briefly, the game is essentially a simulation of the movie Terminator (especially its futuristic scenes), where players leave their underground shelters to recover objects on the surface while being hunted by machines trying to eliminate them — a genre commonly referred to as an “extraction shooter.” The game is not part of the Terminator franchise, but it clearly draws inspiration from the same concepts of futuristic warfare.
Et si les joueurs de jeux vidéos entraînaient les armes de demain ?
Et si les joueurs de jeux vidéos entraînaient les armes de demain ?Depuis quelques mois, nous jouons souvent avec un de mes fils au jeu ARC Raiders. Pour résumer, ce jeu est globalement une simulation du film Terminator (dans ses scènes futuristes), où des joueurs sortent de leur cache souterraine pour récupérer des objets à la surface tandis qu’ils sont pourchassés par des machines cherchant à les éliminer (ce genre s’appelle un « extraction shooter »). Le jeu ne fait pas partie de la franchise Terminator, mais il reprend les mêmes concepts de batailles futuristes.
La particularité de ce jeu est qu’il est l’un des premiers à avoir entraîné ses « robots », contrôlés par l’ordinateur, pendant des mois grâce à de l’intelligence artificielle (machine learning). On sent déjà poindre une certaine ironie : dans le futur du jeu, nous sommes traqués par une IA, et la simulation à laquelle nous jouons utilise justement de l’IA pour nous traquer plus efficacement.
Entendons-nous bien : le machine learning n’est utilisé, pour le moment, que pendant l’entraînement des déplacements des robots ainsi que de leurs stratégies de recherche, d’attaque et d’interaction avec les joueurs avant le lancement des parties, et non pendant leur déroulement en temps réel. Autrement dit, ces données comportementales et ces scripts décisionnels permettant de passer d’une stratégie à une autre sont ensuite intégrés (« codés ») dans le jeu lors des mises à jour.
Cette première utilisation d’un véritable machine learning, même avec un « simple » arbre décisionnel, permet de rendre le jeu étonnamment réaliste. Les mouvements des machines — qu’elles soient volantes ou de type arachnéen — sur des terrains chaotiques (éboulements, escaliers, obstacles) et leurs réactions aux impacts des armes des joueurs donnent presque parfaitement l’illusion d’un véritable insecte ou d’une machine « pensante » qui réagit et s’adapte à nos actions. C’est bluffant, et c’est l’une des raisons majeures du succès du jeu.
Je ne suis pas le premier à parler de ce sujet : il existe déjà des centaines d’articles et de vidéos qui l’analysent, et je n’entrerai pas ici dans les détails techniques de son fonctionnement. Ce qui m’intéresse dans cet article, c’est l’avenir de cette technologie et, potentiellement, son usage détourné.
Pour le moment, il coûterait encore trop cher d’utiliser du machine learning et de la prise de décision par IA en temps réel : soit parce que le coût des requêtes vers un modèle comme ChatGPT pendant toutes les instances hébergées du jeu représenterait une véritable hémorragie financière en tokens, soit parce qu’exécuter un LLM localement sur la machine du joueur resterait encore trop gourmand en RAM, en CPU et en puissance GPU.
Mais nous n’en sommes probablement plus si loin. On peut imaginer, à moyen terme — quelques années tout au plus —, des circuits spécialisés ou mutualisés intégrés aux cartes graphiques, avec davantage de mémoire dédiée, ou encore des abonnements en ligne comparables à ceux des MMORPG, permettant à un agent IA distant de réagir en temps réel aux actions des joueurs.
On peut alors imaginer un pays comme les États-Unis ou la Chine développant ce type de jeu dans lequel les joueurs seraient traqués par des robots tueurs apprenant continuellement des stratégies de défense et d’attaque utilisées par ces mêmes joueurs… avant de réutiliser ces apprentissages pour les appliquer à de véritables robots militaires.
Les joueurs du monde entier — avec leurs spécificités culturelles, locales, d’âge, de sexe ou encore leurs comportements dans des environnements variés (urbains, montagneux, industriels, etc.) — s’amuseraient ainsi à tenter d’échapper virtuellement à des robots… tandis que ces derniers apprendraient et se perfectionneraient en vue d’un usage militaire réel.
Les joueurs deviendraient alors une alternative extrêmement peu coûteuse — voire même une source de revenus — pour améliorer les armes intelligentes des nations les plus avancées technologiquement, par exemple dans des conflits comme la guerre en Ukraine. Et les scientifiques chargés d’améliorer ces systèmes ne pourraient rêver meilleur corpus d’entraînement : des millions de personnes différentes, avec des comportements réalistes et variés. Il suffirait simplement de faire évoluer les cartes et les environnements du jeu pour enrichir continuellement les données collectées.