Ces dernières années, les géants de l’informatique ont englouti plus de 15 milliards de dollars dans l’achat de sociétés spécialisées dans la gestion et l’analyse des milliards de données aujourd’hui en circulation. Ce marché, qui progresse de 10% par an, soit deux fois plus rapidement que les ventes de logiciels, représente déjà près de 100 milliards de dollars, selon The Economist. Et le meilleur serait encore à venir. Ces « datas » ne datent pourtant pas d’hier....
Des datas en veux-tu, en voilà…
« Depuis l’informatisation de la société, les données sont partout présentes », juge Vincent Mady, directeur technique de Tradelab, le premier acheteur indépendant en France d’espaces publicitaires en Real Time Bidding (RTB). Les données dites « structurées » sont déterminées et connues à l’avance. C’est le cas notamment des réservations d’un vol. Les données non structurées ne sont, quant à elles, pas prévisibles (suggestions données sur Internet, billets d’humeur…). Elles peuvent provenir de n’importe qui, être diffusées sur tous types de supports (livre blanc, site, blog, réclamation, questionnaire…) et sous toutes les formes imaginables (différentes langues, phrases longues, langage SMS bourré de fautes…). Le nombre de datas se multiplie à une vitesse exponentielle depuis quelques années. D’après une étude d’IDC, les données numériques créées dans le monde seraient passées de 1,2 zettaoctets en 2010 (1 zettaoctet représente 1021 octets) à 2,8 zettaoctets en 2012 pour atteindre… 40 zettaoctets en 2020.
Cette explosion est une conséquence de l’utilisation massive des objets connectés, comme les tablettes et les smartphones, couplée au succès des réseaux sociaux sur la Toile. Chaque jour, près de 250… milliards de courriels sont échangés et 300 millions de photos sont publiées sur Facebook. 72 heures de vidéo sont également envoyées sur Internet chaque… minute. Ces chiffres sont encore appelés à croître très rapidement. Aujourd’hui, 12 milliards d’objets connectés sont déjà en circulation, d’après le Livre Blanc élaboré par Big Data Paris. Et il devrait y en avoir… 50 milliards avant la fin de cette décennie. Cette masse considérable d’informations attire d’autant plus les entreprises et les pouvoirs publics qu’il est de plus en plus facile de les conserver afin de les analyser. « Les coûts liés au traitement informatique de ces datas ont beaucoup diminué, confirme M. Mady. Il y a encore quelques années, ces technologies étaient réservées à quelques agents économiques comme les multinationales, mais leur usage s’est largement démocratisé ». Mouloud Dey ne dit rien d’autre. « Le coût du stockage de 1 teraoctet ne dépasse pas 100 dollars aujourd’hui alors qu’il atteignait plusieurs milliers de dollars il y a tout juste dix ans, se rappelle le directeur Stratégie et Nouvelles Technologies de SAS, un spécialiste du traitement des données. Il est donc aujourd’hui possible de garder beaucoup plus d’informations que dans le passé ».
Le succès des datas a aussi une raison sociologique
« Les gens aujourd’hui se regroupent sur Internet en fonction de leurs affinités et diffusent de plus en plus d’informations personnelles, ajoute M. Dey. Il est donc aujourd’hui possible de découvrir des segments de consommateurs très pointus et on peut distinguer les prescripteurs des suiveurs parmi les consommateurs grâce aux données qu’ils diffusent eux-mêmes ». En parlant de vous sur Internet, vous permettez sans même le savoir à des entreprises ou à des associations d’adapter à votre personnalité les messages qu’ils veulent vous communiquer.
Des datas, certes, mais pour en faire quoi ?
Ces données permettent donc avant tout de mieux connaître le consommateur qui sommeille en chacun d’entre nous et de prévoir ses comportements. « Le profilage des clients et l’identification de leurs intentions d’acquérir tel ou tel produit est un élément essentiel car ils permettent de préparer des opérations marketing centrées sur leurs désirs », souligne Martin Grosjean, directeur général de Synomia, une entreprise qui exploite scientifiquement la masse de contenus textuels diffusés sur la Toile. En croisant des données les unes avec les autres, les analystes peuvent découvrir des choses qu’ils ne soupçonnaient pas. « Une marque de cosmétiques qui vise les jeunes femmes de 18 à 25 ans peut ainsi trouver des cibles périphériques en modélisant leurs datas, prévient l’expert de Tradelab. Et si vous faites une campagne pour une marque de voiture de luxe par exemple, vous aurez tout intérêt à ne pas vous contenter des coordonnées de ceux qui disent aimer vos produits comme vous le faisiez auparavant mais plutôt de croiser ces informations avec celles concernant leur catégorie socio-professionnelle, afin de savoir si ces personnes ont les moyens financiers d’acheter une de vos automobiles ». Une meilleure connaissance des consommateurs permet de trouver les messages qui feront « tilt » auprès d’eux. Dans un avenir proche, on peut ainsi très bien imaginer un message s’afficher sur le pare-brise de votre berline vous annonçant une promotion exceptionnelle sur un produit que vous avez l’habitude d’acheter dans un magazine situé à 300 mètres de vous. « Les publicités bien ciblées gênent de moins en moins les consommateurs et ce sont les plus efficaces pour les annonceurs, constate Vincent Mady. On créé donc un cercle vertueux dans lequel tout le monde est content ». « La Big Data va nous faire entrer dans l’ère du mieux consommer, renchérit Raphaël de Andreis, directeur général d’Havas Media France. Les données nous permettront de mieux connaître le consommateur et de lui proposer des produits plus adaptés à ses besoins comme le fait un bon vendeur dans un magasin. Cela va créer ainsi de la croissance pour nos clients ».
Aider la recherche médicale
Mais les datas ne sont pas seulement utiles aux « vendeurs ». « Elles peuvent aussi aider la recherche médicale, précise le directeur de SAS. Aux Etats-Unis, des communautés de patients publient des commentaires sur leurs pathologies et sur les effets secondaires de leurs médicaments. Ces données permettent de connaître la façon dont les malades réagissent aux molécules qu’ils prennent. Le gouvernement néo-zélandais a quant à lui défini sa politique de prévention contre le diabète grâce aux informations que nous avons rassemblées sur les malades recensés dans le pays ». En collectant et en analysant toutes les datas récoltées par les capteurs biométriques tels FuelBand ou l’UP de Jawbone, les pouvoirs publics pourraient notamment détecter les citoyens qui risquent de développer une hypertension ou un taux de cholestérol élevé.
Les politiciens peuvent aussi mieux connaître leurs électeurs potentiels grâce aux données qui circulent librement. Barack Obama n’aurait ainsi probablement jamais été réélu en 2012 sans l’aide de la centaine d’analystes recrutés pour sa campagne. Ces spécialistes ont commencé par rassembler sur une gigantesque base de données les datas trouvées notamment dans les registres électoraux publics, sur Facebook Connect et dans les profils de supporters sur MyBarackObama et ObamaForAmerica. Ils ont ensuite bombardé les électeurs potentiels de courriels ciblés. Un internaute intéressé par les questions sociales recevait ainsi des e-mails détaillant les « gaffes » des Républicains concernant l’avortement ou le viol. Le croisement d’analyses sociologiques, géographiques et statistiques a également permis aux démocrates de trouver les thèmes qui encourageraient les femmes ou les hispaniques à voter en leur faveur. Dans un tout autre domaine, le gouvernement belge est parvenu à récupérer 1 milliard d’euros de TVA non payées grâce à l’analyse poussée de ses bases de données.
Qui fait quoi ?
Les premières entreprises à avoir compris l’énorme potentiel de leurs datas sont les émetteurs de cartes de crédit. Les Visa, Mastercard et autres American Express savent ce que vous achetez, à quelle fréquence, à quel endroit, à quel moment et ils peuvent déceler si vous vivez au-dessus de vos moyens ou non en fonction des « ardoises » que vous laissez à la fin du mois. Les compagnies de téléphonie récoltent encore plus d’informations à votre sujet. Elles connaissent les sites sur lesquels vous surfez, ainsi que les personnes que vous contactez et votre position géographique grâce à la localisation par GPS. Le paiement par smartphone, qui se développe actuellement, leur permet en outre de savoir ce que vous achetez, dans quel magasin et à quelle heure de la journée.
Les voitures connectées seront, elles aussi, capables d’enregistrer le moindre de vos déplacements et de « passer » ces informations à qui de droit. Car ces données valent leur pesant d’or. « On peut imaginer un constructeur automobile monétiser auprès des assureurs les données qu’il va collecter sur le nombre de kilomètres que vous effectuez, sur vos excès de vitesse et sur les parcours à risque que vous empruntez », imagine Mouloud Dey. Les sociétés de téléphonie mobile commencent elles aussi à réaliser qu’elles sont assises sur un trésor. « Les trois plus gros opérateurs en Grande-Bretagne se sont regroupés dans une joint-venture pour partager leurs données et les valoriser auprès de clients potentiels comme les distributeurs, ajoute le spécialiste de SAS. Les données seront le pétrole du XXIe siècle ». Pas étonnant dans ce cas que des géants comme Google ou Facebook s’intéressent de très près à ce marché.
Les risques du métier…
Comment parler de Big Data sans évoquer Big… Brother ? « Le risque principal lié aux datas est lié à la protection de la vie privée », reconnaît Martin Grosjean. Les pays ont mis en place des législations très variées dans ce domaine. Entre la France qui interdit beaucoup et les Etats-Unis qui permettent plus ou moins tout, la marge de manœuvre est vaste. Une stricte prohibition semble toutefois vouée à l’échec car les données sont partout présentes aujourd’hui dans notre vie quotidienne. « Interdire l’utilisation de données personnelles serait en outre contre-productif car elles sont bonnes pour l’économie », se défend Mouloud Dey. Certains doutent de cet argument…
Car s’il ne fait aucun doute qu’une bonne utilisation des datas encouragera les consommateurs à succomber plus facilement à la tentation, elle risque aussi de les pousser à faire des achats inutiles. Des « promotions exceptionnelles » sont difficiles à refuser, tout comme l’argent facile des instituts de crédit à la consommation encourage de nombreux foyers à se surendetter.
Les datas risquent enfin de transformer l’individu en simples statistiques. Dis moi où tu vis, ce que tu dépenses, où tu travailles et dans quels endroits tu t’amuses et je te dirai qui tu es ? Heureusement, l’homme est souvent un peu moins prévisible que cela. Et ça, pas sûr aujourd’hui que les professionnels l’aient bien compris...
|
frederic therin
Rédacteur
|