La société hongkongaise Deep Knowledge Ventures (DKV), qui est adossée à des sociétés spécialisées dans les secteurs de la biotechnologie et de la médecine régénérative, a nommé un algorithme à son conseil d’administration. Baptisé « VITAL » (acronyme de Validating Investment Tool for Advancing Life Sciences, « outil de validation d’investissement pour les sciences avancées de la vie » en français), il est désormais le sixième membre du conseil et dispose d’une voix, à l’instar de ses cinq collègues humains. La mission de cet algorithme : l’analyse du bilan comptable des sociétés dans lesquelles DKV souhaite investir, celle des résultats de leurs tests cliniques, de leurs précédentes levées de fonds, de leur liste de brevets… ceci afin de déterminer les meilleures stratégies en termes d’investissement.
COUP DE PUB ?
S’agit-il d’une opération de com ? Ou bien cette décision originale ne serait-elle que le dernier avatar de l’éternel rêve prométhéen de l’humanité ? Dès 1950, Alan Turing, l’un des pères fondateurs de l’informatique, avait posé la question de l’intelligence des machines : « Je propose d’examiner la question suivante : “Les machines peuvent-elles penser ?” » Il envisageait même que les machines puissent apprendre : « L’idée qu’une machine puisse apprendre pourrait apparaître paradoxale pour certains lecteurs. » Depuis, cette idée a fait du chemin. Voilà un demi-siècle que les chercheurs en Intelligence Artificielle (IA) sont en effet à la tâche, explorant les capacités de programmer des machines pour leur permettre d’apprendre.
QU’EST-CE QU’APPRENDRE ?
En sciences cognitives, l’apprentissage consiste à améliorer ses performances lors de l’exercice d’une activité via des interactions avec son environnement – tel l’enfant qui apprend à parler en écoutant ses parents. Mais apprendre, c’est aussi savoir généraliser de manière rationnelle ; il en est ainsi de l’apprentissage par induction, qui consiste à savoir créer une loi à partir d’observations.
Sous-domaine de l’intelligence artificielle, le Machine Learning (ML), apprentissage automatique (ou statistique) en français, s’intéresse au développement de méthodes automatisables qui permettent à une machine d’évoluer grâce à un processus d’apprentissage. Ce dernier repose sur l’interaction avec l’environnement et a pour but d’accomplir des tâches difficiles, voire impossibles par des moyens algorithmiques plus classiques.
Jusqu’aux années 1990, l’apprentissage automatique, utilisé notamment pour identifier des caractères ou des images, s’appuyait sur un modèle dit « génératif » de ce qu’il fallait reconnaître. Ce n’est qu’après 1995, avec la parution de l’ouvrage fondateur de Vladimir Vapnik1, que la théorie statistique de l’apprentissage a véritablement pris son essor.
MAIS POURQUOI DONC APPRENDRE
À UNE MACHINE À APPRENDRE ?
Pour au moins quatre raisons essentielles, et quatre contextes illustratifs pour mieux comprendre. Quand on ne peut pas programmer ce que l’on cherche à accomplir, par exemple pour reconnaître la parole, l’image ou le geste. Quand on ne sait pas « passer à l’échelle » (ndlr : en informatique, on parle de scalability ou scalabilité pour désigner la capacité d’un produit à s’adapter à un nouvel ordre de grandeur, une demande accrue, etc. et à rester fonctionnelle et performante), par exemple pour vous présenter des recommandations d’achat sur un site de commerce en ligne ou détecter le spam dans votre boîte aux lettres. Quand on doit adapter ou personnaliser une interaction entre l’homme et la machine, par exemple la capacité de votre smartphone à vous « prédire » les mots que vous allez saisir. Et enfin quand on ne peut pas aller assez vite, par exemple pour un jeu vidéo à intelligence artificielle ou pour contrôler un robot.
En fait, même si nous ne le savons pas, nous utilisons déjà le Machine Learning au quotidien : user de moteurs de recherche, recourir à un service de traduction automatique en ligne ; mettre une lettre à la poste et par ce geste convoquer un système de reconnaissance optique qui analyse l’adresse et envoie au bon endroit ; employer un capteur Kinect pour interagir avec son ordinateur ou sa console de jeux vidéo… car sans ML, Kinect n’existerait pas.
UN ORDINATEUR POURRAIT-IL
S’AUTOPROGRAMMER ?
Cela pourrait aller plus loin encore, car le ML cherche à répondre à la question : « Comment pouvons-nous construire des systèmes informatiques qui s’améliorent automatiquement avec l’expérience, et quelles sont les lois fondamentales qui régissent tous les processus d’apprentissage ? » Le ML est un prolongement naturel de l’intersection entre l’informatique et les statistiques. Si l’on considère que l’informatique a porté principalement sur la façon de programmer manuellement des ordinateurs, le ML se concentre sur la question de comment faire en sorte que les ordinateurs se programment eux-mêmes (à partir de l’expérience, plus une structure initiale). D’autres domaines, de la biologie à l’économie, se posent également la question de savoir comment les systèmes peuvent s’adapter automatiquement à leur environnement, et le ML sera probablement amené à échanger des idées avec l’ensemble de ces domaines au cours des années à venir.
d'autres domaines, de la biologie à l'économie,
se posent également la question de savoir
comment les systèmes peuvent s'adapter
Illustrations d'Elvire Caillon
QUELS PROGRÈS ATTENDRE pour
l'homme DU MACHINE LEARNING ?
Il reste de nombreux champs ouverts dans le domaine du Machine Learning, car beaucoup d’interrogations restent sans réponse. Tout d’abord : pourrait-on concevoir des langages de programmation contenant des primitives de ML ? Une nouvelle génération de langages de programmation pourrait-elle supporter directement l’écriture de programmes qui apprennent ? Dans de nombreuses applications actuelles du ML, des algorithmes de ML sont intégrés à la main au sein d’une application métier. Pourquoi ne pas concevoir un nouveau langage de programmation qui prendrait en charge l’écriture de programmes dans lesquels certains sous-programmes seraient codés « comme d’habitude », tandis que d’autres seraient spécifiés comme « à apprendre » ?
Ensuite : ne pourrait-on pas construire des machines apprenant en permanence ? La grande majorité des travaux en ML aujourd’hui consistent à impliquer des algorithmes sur des données spécifiques, puis à mettre de côté l’apprentissage afin d’utiliser le résultat obtenu. Cela a contrario de l’apprentissage chez les humains et les animaux, qui consiste en un processus continu, où l’on apprend différentes capacités, souvent au fur et à mesure, que l’on utilise de manière synergique. Nous rêvons de machines apprenantes qui « s’instruiraient » de cette même façon cumulative, de manière à les rendre de plus en plus compétentes, plutôt que de les cantonner à ce qu’elles ont appris initialement.
VERS UNE THÉORIE GÉNÉRALE
DES PROCESSUS COGNITIFS
Au niveau de nos sens, ne pourrait-on imaginer que la perception par ordinateur fusionne avec le ML ? Compte tenu de l’utilisation croissante du ML dans la vision, la reconnaissance vocale et d’autres formes de perception par ordinateur, pourrait-on développer une théorie générale de la perception ancrée au sein des processus d’apprentissage ? Ceci constituerait une occasion unique d’incorporer plusieurs modalités sensorielles (par exemple la vision, l’ouïe, le toucher) afin de fournir un cadre dans lequel l’auto-apprentissage supervisé serait appliqué afin de prédire une expérience sensorielle à partir des autres. Déjà les chercheurs en sciences de l’éducation ont observé que l’apprentissage peut être plus efficace si plusieurs de nos sens sont convoqués simultanément.
En termes épistémologiques, les théories et les algorithmes de ML pourraient-ils aider à expliquer l’apprentissage humain ? Récemment, ils ont été jugés pertinents pour la compréhension de certains aspects de l’apprentissage tant chez l’homme que chez l’animal. Par exemple, les algorithmes et les théories de l’apprentissage par renforcement prédisent étonnamment bien l’activité neuronale des neurones dopaminergiques chez les animaux lors d’un apprentissage fondé sur la récompense (cf. théorie de Pavlov). Cependant, les théories de l’apprentissage chez l’animal mettent en œuvre des considérations telles que la motivation, l’urgence, la peur, l’oubli… qui n’ont pas encore été prises en compte dans le ML. C’est peut-être là une opportunité de fertilisation croisée avec la possibilité d’élaborer une théorie générale des processus d’apprentissage couvrant aussi bien les animaux que les machines, avec des implications potentielles pour l’amélioration des stratégies d’enseignement scolaire.
QUESTIONS ÉTHIQUES
Le Conseil d’État, dans son étude annuelle 2014 « Le numérique et les droits fondamentaux »2, se posait des questions sur les prédictions dont sont capables les algorithmes de ML en recommandant de « mieux encadrer l’utilisation d’algorithmes prédictifs à l’égard des individus ».
Si nous voulons vivre dans un monde toujours plus riche en données où le ML tient toutes ses promesses, nous devrons nous focaliser à la fois sur l’utilisation des données qui permettent à la machine d’apprendre, sur leur contrôle par l’utilisateur et sur la transparence de leurs usages. Parce que la confiance se construit sur la transparence. Et que sans la confiance, il est très probable que ce nouveau monde extraordinaire auquel permet de rêver le Machine Learning ne se matérialisera jamais.
1. Vladimir N. Vapnik, The Nature of Statistical Learning Theory, Springer-Verlag, 1995. 2. http : //www.ladocumentationfrancaise.fr/rapports-publics/144000541-etude-annuelle-2014-du-conseil-d-etat-le-numerique-et-les-droits-fondamentaux
|
bernard ourghanlian
Il joint Microsoft France en 1999 au poste de directeur général technique. Il est depuis 2002 directeur technique et sécurité, responsable de la conduite globale de la stratégie de Microsoft en France en matière de technologie et de sécurité.
|