«Mais qu’est ce qu’on va faire de toutes ces données ?». Les données, ce qu’elles sont, ce que l’on va en faire, c’est LE sujet. Il y a même un mot pour ça: Big Data. Et des conférences à la pelle, qui tentent chacune de répondre à cette question: que faire de cette masse informe et gigantesque de données produites chaque seconde ?
La digitalisation de nos vies fait de (presque) chacune de nos actions une source de données. Ces données sont accessibles en temps réel via de nombreuses API, stockées par une multitude d’opérateurs dans le monde entier, et flottent dans le cloud. La fascination qu’elles céent repose sur l’illusion de contrôle, l’illusion d’une connaissance quantitative du monde et surtout, des individus.
Illusion parce que la vision statistique du monde se heurte à l’irrationalité humaine et au fonctionnement même du cerveau : la donnée n’a de sens, dans sa capture comme dans sa restitution, que si elle s’accompagne d’une narration (une temporalité) et d’un contexte. C’est la principale différence entre le cerveau et une machine: nous hiérarchisons l’information selon des critères émotionnels. Sans compréhension des mécanismes conscients et subconscients, aucune donnée n’a de sens.
Ainsi, la démonstration d’Erik Swan, (fondateur de Splunk, une plateforme de suivi de données en temps réel) est un exemple parfait du problème posé. Concrètement, il nous montrait comment il pouvait agréger en temps réel les données de Check-in dans les chaines de cafés (Starbuck et Cie) pour observer la « coffee war » du matin.
C’est très joli et très intéressant, mais démontre par l’absurde la faillite de ce système. En effet, ce sont des données «opt-in», c’est à dire que des individus choisissent délibérément de signaler leur présence. Dès lors, comment pondérer le biais sociologique, comportemental et contextuel que ces données comportent: qui déclare, pourquoi, et quels facteurs influencent cette décision ? la durée de l’attente ? l’heure ? la circulation ? une promotion spécifique ? Sans ces éléments, impossible de sortir ces données de leur étroit contexte: qui gagne la «check-in coffee war». Ce qui est nettement moins intéressant. L’enjeu majeur, pour que cette masse de données soit utile, c’est d’arriver à les croiser. Ce qui pour l’instant est à peu près impossible, tant elles proviennent de contextes différents.
Et pourtant, la fascination quantitative continue à opérer chez tous, ici, qui cherchent à comprendre et organiser le monde en oubliant qu’il est peuplé d’êtres humains par essence irrationnels. Comme le dit Nicola Hughes, (Datamineruk.com) avec justesse et résignation : «Big Data allows us to be wrong with infinite précision».
Henry Jeantet
Head of Strategic Nurun