Catégories
Intelligence artificielle

La dernière percée de DeepMind…

Cher lecteur,

OpenAI et ChatGPT ont récemment accaparé tous les projecteurs dans le domaine de l’IA. Mais il ne faut pas oublier DeepMind, la division IA de Google, qui a été la plus impressionnante dans ce domaine jusqu’à présent.

Et comme si c’était le cas, DeepMind vient de révéler une nouvelle avancée. Elle s’appelle DreamerV3. C’est l’abréviation de « version trois ».

DreamerV3 est une IA générale alimentée par une technologie appelée « apprentissage par renforcement ». Il s’agit d’une IA à laquelle on donne des objectifs mais qui n’est jamais entraînée à les accomplir. Au lieu de cela, l’IA doit s’auto-apprendre au fur et à mesure.

Il s’agit d’un domaine brûlant de l’IA à l’heure actuelle. Si nous pouvons produire des IA générales capables d’apprendre par elles-mêmes à accomplir des tâches grâce à l’apprentissage par renforcement, il n’y a aucune limite aux applications pour lesquelles nous pourrions utiliser cette technologie.

Chaque année, lors de la conférence NeurIPS – l’une des plus importantes conférences sur l’IA de l’année – il y a un grand concours d’apprentissage par renforcement.

Depuis 2019, cette compétition s’appelle MineRL Diamond Competition. C’est là que les IA s’affrontent pour voir lesquelles peuvent apprendre à extraire des diamants dans le populaire jeu multijoueur en ligne Minecraft.

Je sais que cela peut sembler idiot à première vue. On peut penser qu’il s’agit juste d’une compétition « amusante » impliquant un jeu. Mais pourquoi faire en sorte que les IA apprennent à jouer à des jeux ?

La réponse est que le processus d’extraction de diamants dans Minecraft est incroyablement nuancé. Il nécessite beaucoup d’exploration dans le jeu. Il y a un tas de variables qui entrent en compte. Et il y a plusieurs séquences d’action que les joueurs doivent faire afin de réussir à extraire un diamant.

Et voilà le problème : seules certaines de ces séquences sont vraiment significatives. Mais la seule façon de déterminer quelles actions sont importantes et lesquelles ne le sont pas, c’est par essais et erreurs.

Mettez tout cela ensemble, et c’est un problème très difficile pour les IA à résoudre. Il s’avère que Minecraft est une excellente « salle » d’entraînement pour les applications du monde réel.

DreamerV3 a donc été lâché dans Minecraft et on lui a demandé d’extraire des diamants. Il n’a pas reçu d’instructions ou d’informations supplémentaires. Aucune orientation humaine du tout.

Dans le premier modèle de formation, DreamerV3 a fait 100 millions de pas dans le jeu avant de produire son premier diamant. Ce n’est pas génial. Mais l’IA a rapidement appris à devenir de plus en plus efficace dans l’extraction de diamants. L’expérience d’apprentissage par renforcement de DeepMind a été un grand succès.

Croyez-le ou non, il s’agit d’une avancée considérable pour l’industrie.

C’est parce que DreamerV3 est un modèle ouvert. Il peut se concentrer sur tout ce que nous voulons. DeepMind l’a juste concentré sur Minecraft, dans ce cas… mais il pourrait être utilisé pour aborder n’importe quel problème.

Et je suis certain que nous allons voir DeepMind tourner DreamerV3 sur certains problèmes majeurs du monde réel cette année. Il pourrait s’agir de systèmes de gestion du trafic. L’IA pourrait être chargée d’optimiser les schémas de circulation pour réduire les embouteillages et les accidents.

Une autre grande application serait les réseaux logistiques. DreamerV3 pourrait apprendre à améliorer les itinéraires pour minimiser la consommation d’essence et améliorer les délais de livraison.

Il existe tellement de problèmes complexes auxquels le cadre d’apprentissage par renforcement de DeepMind pourrait être appliqué. J’ai hâte de voir sur quoi ils se concentreront en premier.

Il s’agit donc d’une percée bien plus importante que ce que la plupart des gens pensent. Je suis convaincu que nous verrons de grandes choses de DreamerV3 et/ou de ses travaux dérivés cette année.

Suivez ce lien pour en savoir plus sur l’IA et comment en profiter au maximum.

Salutations,

Jeff Brown

Laisser un commentaire