Intelligence Artificielle : Alpha Go n’apprend plus que par elle-même

Intelligence Artificielle : Alpha Go n’apprend plus que par elle-même
Innovation

intelligence-artificielle-alpha-go

Nouvelle spectaculaire étape dans la progression de l’IA : DeepMind, la filiale de Google spécialisée dans ce domaine, vient de présenter la nouvelle version de son IA Alpha Go. Si la précédente avait réussi à vaincre le champion du monde, la dernière est désormais autodidacte : elle n’apprend qu’en jouant contre elle-même, sans supervisation humain. Et peut, en un mois, atteindre seule un niveau lui permettant d’écraser tous les joueurs humains.

DeepMind avait annoncé la retraite d’Alpha Go, qui allait cesser d’affronter des joueurs humains pour se consacrer à des questions d’utilité générale. L’Intelligence Artificielle développée par la filiale de Google n’avait plus rien à prouver, ayant battu le champion du monde.

Mais DeepMind vient de présenter sa nouvelle version, nommée Alpha Go Zero : elle s’appuie encore sur la logique du jeu le plus complexe au monde pour prouver son efficacité.

Une Intelligence Artificielle autodidacte

La révolution est que cette IA n’a plus besoin d’analyser des parties de champions humains pour progresser. Elle peut seule apprendre à jouer et à progresser, en jouant contre elle-même. La seule information extérieure donnée à l’IA est un livre de règles de jeu de go. Et, au bout de trois jours, qui lui ont permis de jouer 4,9 millions de partie contre elle-même, Alpha Go Zero avait atteint un niveau de champion humain.

Pour s’en convaincre, les ingénieurs de DeepMind l’ont confronté à Alphe Go Lee, la version qui, en 2016, avait battu 4 à 1 l’un des meilleurs joueurs du monde Lee Sedol – et ce après avoir bénéficié d’un apprentissage supervisé par des humains qui lui proposaient d’analyser les meilleurs affrontements de l’histoire du go, puis avoir joué 30 millions de parties contre la version précédente d’Alpha Go.

« Plus restreinte par les limites de la connaissance humaine »

Le résultat est sans appel. Alpha Go Zero : 100. Alpha Go Lee : 0. La version Alpha Go Master, qui avait battu en 2017 le champion du monde Ke Jie, a donné plus de fil à retordre à la petite nouvelle. Il a fallu 21 jours d’entraînement solitaire à Alpha Go Zero pour atteindre son niveau. Et 40 jours pour le surpasser, et atteindre un niveau qualifié « d’inhumain » par DeepMind.

« Alpha Go Zero est plus puissante que les versions précédentes d’AlphaGo car elle n’est plus restreinte par les limites de la connaissance humaine », ont précisé les chercheurs de DeepMind dans un billet de blog : « Au lieu de cela, AlphaGo est capable d’apprendre à partir de zéro auprès du joueur le plus fort au monde : AlphaGo lui-même ».

Cette version répond clairement aux critiques qui ont pu être formulées contre les précédentes versions, arguant qu’elles avaient eu besoin d’un accompagnement humain, et que leur réseau neuronal n’était pas capable d’apprendre seul. Cette brillante réussite est aussi un message envoyé par Google à tous les autres géants du net lancés dans la bataille de l’IA : DeepMind est à la pointe des réseaux neuronaux et de l’apprentissage profond.

Une réussite saluée par la communauté scientifique

Encore plus prometteur : le programme nécessite bien moins de ressources informatiques en terme de disques durs et de mémoire vive que les versions précédentes. De quoi lui permettre de basculer plus simplement vers d’autres applications que le jeu de go.

En tout état de cause, cette version réussit un tour de force en proposant un apprentissage profond à un programme informatique seul, sans aucun accompagnement humain. De quoi justifier un article dans Nature, une des revues scientifiques les plus renommées – preuve que cette avancée n’intéresse pas que le champ des experts informatiques, mais est vécue comme un événement par l’ensemble de la communauté scientifique.

DeepMind, et donc Google, viennent donc de marquer un point important dans la course à l’Intelligence Artificielle la plus accomplie que se livrent les géants du numérique, attirés par l’ampleur de ce marché.