16 février 2022

Temps de lecture : 5 min

La data science, toujours le métier le plus sexy au monde ?

En analysant des millions de données, ils sont capables de prédire l’avenir. La relève de Madame Irma est là : ce sont les data scientists, advenus avec le millénaire et depuis lors adulés. Le secteur a toutefois bien muté ces dernières années et de nouveaux besoins ont impliqué l’apparition de nouveaux métiers. Ces scientifiques, ou plutôt « experts en mégadonnées »1, travaillent aujourd’hui avec des analystes, des ingénieurs et des architectes de la donnée. L’intelligence artificielle et l’apprentissage automatique (« machine learning ») sont désormais capables de remplir des tâches qui étaient auparavant confiées à des humains. Retour sur une profession définitivement sexy et en constante évolution. Cet article a été publié dans le numéro 38 de la revue INfluencia intitulé Data, La nouvelle identité. Pour le consulter ou vous abonner c'est ici !

Gourou de notre société, oiseau rare appartenant à une nouvelle « caste » de professionnels… Dans un précédent opus de notre revue centré sur la Data (publié en 2014), Jean-Paul Isson, le chef de la science des données et de l’intelligence artificielle chez le fournisseur de solutions technologiques pour le secteur aérien Sita, faisait un véritable panégyrique des data scientists. Sept années ont passé, soit une éternité dans ce monde où la technologie s’accélère à une vitesse exponentielle. En 2015, le volume annuel de données numériques créées à l’échelle mondiale ne dépassait pas 12 zettaoctets (1 zettaoctet [Zo] équivaut à 1000 milliards de gigaoctets [Go]). Cinq ans plus tard, il atteignait déjà 47 Zo et le cap de 612 Zo sera probablement franchi en 2030. Pour 2035, les prévisionnistes − qui publient leurs estimations dans le Statista Digital Economy Compass − tablent sur un chiffre de 2142 Zo. En deux décennies, le volume de données devrait ainsi être multiplié par plus de 178 fois ! « La data, c’est le nouvel or noir de la planète, mais si vous n’avez pas les moyens de le raffiner, vous vous retrouvez juste avec un truc polluant dont vous ne savez quoi faire, résume Olivier Girardot, le directeur de la data chez Malt, une plateforme de 280 000 free-lances qui comprend une majorité de profils “tech”. Les spécialistes de la data sont ceux qui transforment ce pétrole en carburant. »

Une pyramide d’experts

Longtemps, ces « geeks » capables de déceler des tendances ou des anomalies en lisant des colonnes de milliers de chiffres étaient tous définis comme des data scientists. Avec le temps, ce secteur s’est professionnalisé, segmenté, et de nouveaux titres sont apparus sur le marché du travail : data analyst, data architect, data engineer, data visualisation… Néanmoins, dans le lot, le data scientist a conservé ses « lettres de noblesse ». « Son rôle est de déceler des choses intelligentes au sein des données et de développer des modèles prédictifs, décrit Olivier Girardot. Il est capable de trouver trois points parmi des milliers de chiffres afin de tracer une ligne qui montrera une direction à suivre. Son profil est celui d’un mathématicien qui utilise beaucoup les techniques de la probabilité, des algorithmes et du machine learning. » Ces scientifiques se trouvent au sommet de la pyramide des spécialistes de la donnée. « L’analyste a pour mission de remettre de l’ordre dans toutes les data qu’il peut récupérer, alors que le scientifique cherche surtout à comprendre ce qui va se passer dans le futur en faisant des projections sur les trois prochaines années », précise Julia Cames, la directrice du marketing de HubSpot France.

Le data scientist de 2014 ne pourrait plus travailler pour une entreprise de 2021

Miroir, mon beau miroir… En 2012, la Harvard Business Review avait déjà décrit la data science comme étant le « job le plus sexy du xxie siècle » et cet article avait créé une véritable lame de fond dans le monde de la tech. Les universités et les écoles ont voulu profiter de l’aubaine et mis en place des formations spécialisées dans la data science. « Les premiers scientists avaient suivi des études de mathématiques et de statistiques, rappelle Olivier Girardot. Beaucoup avaient un doctorat, d’autres étaient ingénieurs et ils se tous formés sur la data sur le tas. »

Les trois quarts des algorithmes qui sont utilisés dans la data science ont été créés dans les années 1970-80

Si la collecte, le traitement et l’interprétation des données collectées sur le Web sont des métiers assez récents, la plupart des théories qui permettent aux data scientists de faire leurs prévisions ne datent pas d’hier, ni même d’avant-hier. « Un des algorithmes les plus utilisés aujourd’hui pour résumer de longs textes se base sur une méthode inventée en 1870, dévoile le directeur de la data chez Malt. Cet algorithme est tombé dans les oubliettes jusqu’à ce qu’on le traduise en langage informatique cent ans plus tard. Les trois quarts des algorithmes qui sont utilisés dans la data science ont été créés dans les années 1970-80 et ils se basent presque tous sur les techniques de la probabilité. » Et bien que la plupart des théories dont elle se sert soient relativement anciennes, la profession la plus « sexy » au monde fait montre de réelles capacités d’évolution. « Le data scientist de 2014 ne pourrait plus travailler pour une entreprise de 2021, résume Christophe Negrier, vice-président Technologie chez Oracle France. Il doit aujourd’hui avoir une approche plus transparente parce que l’éthique est devenue un sujet central. Il doit aussi pouvoir communiquer et interagir avec les autres collaborateurs de la société qui l’emploie. Il a également besoin de nos jours d’être épaulé par d’autres spécialistes (comme des codeurs et des statisticiens) et il doit être capable d’embarquer ses collègues pour monter des projets en commun. Le data scientist ne peut plus être, comme cela pouvait être dans le passé, une sorte de professeur Tournesol qui imagine des algorithmes tout seul dans son coin. »

Autocréation de métiers

Sans compter que la machine, elle, boostée à l’IA, est capable bien souvent maintenant de remplacer ces mathématiciens du numérique. « Ce métier va continuer d’évoluer, car le marché va devenir de plus en plus mature, prédit Christophe Negrier, qui a occupé auparavant le poste de vice-président en charge des ventes chez SAP France. Les offres packagées et enrichies de capacités d’analyse des données vont être plus nombreuses. La plupart des demandes des entreprises seront satisfaites par les solutions proposées par des groupes comme le nôtre. Depuis quelques années, on constate en effet que le nombre de data scientists essentiellement dédiés à la recherche pour les sociétés est en baisse constante. Les grands groupes qui ont des besoins spécifiques, les startups du numérique et les sociétés de la tech comme Oracle continueront à embaucher ces profils, mais les autres firmes vont, elles, chercher à recruter d’autres types de métiers liés à la data. » Ce phénomène est déjà perceptible aujourd’hui. « Beaucoup de gens veulent être data scientist, mais l’offre dépasse déjà la demande, prévient Olivier Girardot. Sur Malt, le nombre de requêtes mensuel sur les mots clés afférents à “data scientist” avoisine les 3000, alors que nous avons près de 4500 profils free-lances de ce type sur notre plateforme. Ce fossé est logique. Le nettoyage et le traitement des données représentent en effet 80% des besoins des entreprises, et ce travail peut être accompli par des analystes et non par des scientifiques − qui sont frustrés par ces tâches et préfèrent mettre au point des modèles prédictifs. » Avec un salaire annuel de départ compris entre 35000 et 38000 euros, qui peut grimper à 45000 ou 55000 euros après quelques années, un data analyst coûte également bien moins cher qu’un data scientist, qui espère toucher entre 50000 et 60000 euros dès la fin de ses études et dont les émoluments peuvent approcher 80000 voire 100000 euros lorsqu’il sera considéré comme « senior ».

La collecte et l’exploitation des données sont devenues des questions de survie pour les entreprises. Et pour donner de la valeur à la data, rien ne vaut un data scientist. 

Les « as de la données » ne risquent toutefois pas d’être détrônés par la machine de si tôt. « Les data scientists ne vont pas disparaître, conclut Julia Cames. Leur métier a beaucoup évolué. Par le passé, on leur demandait de faire un peu tout et n’importe quoi. Aujourd’hui, ils doivent juste faire ce qu’ils font le mieux : des projections pour les prochaines années basées sur les données recueillies aujourd’hui. » Christophe Negrier partage la même opinion : « La collecte et l’exploitation des données sont devenues des questions de survie pour les entreprises. Et pour donner de la valeur à la data, rien ne vaut un data scientist. » Les journalistes de la Harvard Business Review ne diront pas le contraire…

 

 

 

Allez plus loin avec Influencia

the good newsletter

LES FORMATIONS INFLUENCIA

les abonnements Influencia