Un enfant de cinq ans saurait faire ça, mais pas l'IA ?
L’intelligence numérique va-t-elle finir par s’approcher de l’intelligence humaine ?
Non, et loin s’en faut, si l’on en reste aux mécanismes statistiques comme les réseaux de neurones.
Certains élèves de Télécom Paris ne doutent de rien. En tout cas pas en ce qui concerne les pouvoirs de l’intelligence artificielle (IA). Trouver un vaccin contre la Covid ? Résoudre le dérèglement climatique ? Pas de problème. Il suffit d’accumuler suffisamment de données, puis d’entraîner des machines sur ces données, et voilà ! L’IA trouvera la solution toute seule. Voire !
Il faut dire que leurs enseignants entretiennent parfois cette « foi » dans la toute-puissance de l’IA et des réseaux de neurones sur lesquelles elle s’appuie. À tout problème est associée une mesure de l’erreur, la « loss-function », que le réseau de neurones peut corriger de proche en proche jusqu’à obtenir une performance presque parfaite. Vraiment ?
LE SECRET DE LA LICORNE
Le fossé qui sépare l’intelligence artificielle de son modèle humain reste béant.
Premier exemple : montrez une licorne à un enfant de cinq ans qui n’en a jamais vu auparavant. Il fera immanquablement remarquer que ce cheval est bizarre : c’est quoi cette corne au milieu du front ? Ce qui est évident pour l’enfant est hors de portée des réseaux de neurones. Ceux-ci sont des machines statistiques. Ils apprennent à apparier des données avec des catégories connues. S’ils n’ont jamais vu de licorne, ils la verront comme un cheval parfait. Rien, dans leur constitution, ne leur permet de repérer que licorne = cheval + corne. Il leur manque un mécanisme particulier, un secret que tous les enfants connaissent et invoquent spontanément, sans effort et sans expérience préalable. Ce mécanisme, appelons-le contraste, permet à l’enfant non seulement de voir le cheval dans la licorne (ce que ferait un réseau de neurones), mais d’aller au-delà en contrastant l’objet vu avec l’objet reconnu : licorne – cheval = corne.
LE Q.I. DE L’I.A.
Faisons ensuite passer un test de Q.I. à l’intelligence artificielle. Demandons-lui comment continuer la suite : « 1223334444 ». L’enfant assez grand pour savoir compter répond presque sans réfléchir « 55555 ».
Encore une prouesse largement hors de portée des programmes d’IA, sauf bien sûr pour ceux qui trichent en allant chercher la réponse sur la Toile. Que manque-t-il à l’intelligence artificielle pour résoudre un tel problème ? Davantage de données ? Non. Une machine connaissant tous les tests de Q.I. par cœur ne sera regardée par personne comme intelligente. Davantage de puissance de calcul ? Non plus. La taille des processeurs n’y fera rien. Vous pouvez augmenter le nombre de couches d’un réseau de neurones à apprentissage profond, il ne verra toujours pas la structure, si évidente pour nous, présente dans « 1223334444 ». Ce qui manque ici est encore un mécanisme : celui qui permet de résumer l’information, de la comprimer pour la simplifier. Ainsi, « 4444 » est un « 4 » répété 4 fois, « 1234 » est une suite croissante, et finalement la suite de départ correspond à la suite croissante où n est répété n fois. Le cerveau humain semble avoir évolué pour comprimer l’information. C’est pour cela qu’il est intelligent. L’accumulation statistique à l’œuvre dans les réseaux de neurones n’est qu’un moyen bien fruste de comprimer l’information qui se révèle impuissant dans ce test de Q.I. élémentaire.
LE PÈRE DES ENFANTS DE SÉGOLÈNE
Dans un contexte approprié, l’expression « le père des enfants de Ségolène » sera comprise comme se référant à une personne bien déterminée, disons « François ».
Non seulement cette interprétation demande zéro statistique, mais une machine statistique est par construction aveugle à la particularité de chaque contexte. Elle ne peut travailler que sur des contextes standard, moyens. Il lui manque encore une fois un mécanisme, que l’on peut appeler l’interprétation procédurale. Le sens d’une expression comme « le père des enfants de Ségolène » ne peut se calculer à l’avance, à coup de big data. L’intelligence prémâchée a des limites. Pour passer des mots au sens, il faut les confronter au contexte et réaliser un authentique calcul, une procédure, qui construit le sens à la volée. Ce calcul dépend de la syntaxe de la phrase. Demandez-vous ce que signifie « les enfants du père de Ségolène » pour prendre conscience du type de procédure mise en jeu.
VERS UNE IA DES MÉCANISMES
D’un côté, nous avons l’IA numérique, principalement liée aux réseaux de neurones, qui repose sur un mécanisme statistique. C’est cette IA qui a connu des progrès fulgurants dans la dernière décennie. Ces techniques apprennent presque par cœur. Pour le reste, elles relient les exemples appris par continuité. Leur grand intérêt est qu’elles fonctionnent sur des données brutes (des images par exemple). C’est très bien pour diagnostiquer un cancer du sein. Cela ne fonctionne plus dès qu’on s’éloigne de la tâche apprise. Ne demandons pas à ces IA de trouver un vaccin pour la Covid19 ou de résoudre le dérèglement climatique.
De l’autre côté, l’intelligence humaine semble reposer sur un petit ensemble de mécanismes. Nous avons évoqué le contraste, la compression et l’interprétation procédurale. Les chercheurs en ont identifié plusieurs autres, tous fascinants à comprendre.
Citons le calcul aspectuel qui permet par exemple de comprendre la différence entre : « pas toujours » et « toujours pas ». Ou le calcul syntaxique qui oblige à considérer que si « elle pense que Marie est belle », « elle » n’est pas Marie. Ou encore le calcul de la pertinence selon lequel l’énoncé « il y a de l’eau » demande un contexte problématique (soif, panne, fuite, sécheresse…) pour ne pas susciter un « Et alors ? » en réponse.
L’avenir de l’IA ne réside pas tant dans l’augmentation des puissances de calcul ni dans le recueil de données toujours plus massives, que dans la rétro-ingénierie de ces mécanismes cognitifs. L’IA statistique montrera bientôt ses limites. Si l’on veut maintenir l’engouement des élèves de Télécom Paris pour l’IA, faisons-les travailler sur l’automatisation des mécanismes de l’intelligence plutôt que sur le simple traitement numérique des données.
Jean-Louis DESSALLES
Enseignant-chercheur en intelligence artificielle à Télécom Paris. Il travaille sur le calcul du sens et de la pertinence dans le langage naturel.
Il est l’auteur de : Des intelligences Très artificielles (O. Jacob, 2019).