Ouvert aux commentaires.
Pourquoi les machines deviennent-elles très rapidement beaucoup plus intelligentes que nous ? C’est une question de culture. Une machine qui apprend toute seule n’est pas contrainte par la nôtre, celle des humains.
Comme l’explique David Silver dans ces deux petites vidéos, une machine qui apprend toute seule, en essayant de se battre elle-même, améliore sa performance à partir de rien : « from scratch », à partir de zéro, de la tabula rasa, à partir de l’ignorance totale.
Tant que la machine apprend à partir de la manière dont nous résolvons les problèmes, parce qu’on lui enseigne en lui disant de battre un adversaire dans des parties « historiques », elle participera de la « culture » que nous avons bâtie, nous humains, sur la manière de jouer ce jeu. Mais dès que la machine redécouvre entièrement le jeu, à partir de rien, elle n’est plus liée par nos conventions implicites relatives à ce que c’est que bien jouer. Vous vous souvenez peut-être de cette percée en 2015 quand, dans le jeu vidéo vintage casse-briques, la machine avait soufflé tous les anciens joueurs de ce jeu en allant casser des briques par au-dessus, en allant ricocher sur le plafond de l’écran.
Nous étions victimes d’une convention implicite propre à notre culture d’humains qui voulait qu’on ne casse évidemment les briques que d’en-bas.
AlphaGo de DeepMind (groupe Google) avait appris à partir de parties de Go jouées par des humains. Elle ne jouait pas si mal : elle avait battu tous les champions humains. AlphaGo Zero a elle appris toute seule, en essayant de se battre elle-même. Elle a battu AlphaGo par … 100 à 0.
AlphaGo était une classe au-dessus des humains. AlphaGo Zero est une classe au-dessus de AlphaGo.
P.S. Oui je sais, AlphaGo Zero n’est pas capable de faire la vaisselle entre deux parties. Nous nous rassurons comme nous le pouvons, nous pauvres humains.
Laisser un commentaire