6 June 2018

Modèles économiques des données : une relation complexe entre demande et offre (1)

Cette série de trois articles vise à mieux comprendre comment s’organisent actuellement les échanges de données. Dans ce premier article, je décris le côté de la demande, en étudiant pourquoi, et comment, les données acquièrent de la valeur. Dans l’article suivant, je considère le côté de l’offre, en examinant d’où viennent les données et qui en contrôle la production et la collecte. Enfin, dans le troisième article, je décris les différentes modalités sous lesquelles l’offre et la demande se rencontrent.

Big data

(La version intégrale de cette étude est parue dans le Numéro 2 (Juin 2018) d’Enjeux Numériques. Tous les articles de ce numéro sont consacrés à l’économie et à la régulation des Big Data. Ils sont en libre accès ici.)


Introduction

Le 19 mars 2018, Facebook dégringole en Bourse après la révélation que la société Cambridge Analytica a utilisé les données personnelles de près de 50 millions d’utilisateurs du réseau social sans leur consentement1. On apprend aussi ce jour-là que les selfies des internautes, qui peuvent servir à valider des processus d’identification, se négocient à des prix allant jusqu’à 70 dollars sur les marchés clandestins du ‘Dark Web’. Quelques mois plus tôt, la société iRobot revenait sur ses déclarations antérieures selon lesquelles elle cherchait à revendre les données collectées par ses robots aspirateurs Roomba, capables de réaliser une carte virtuelle des endroits qu’ils nettoient. La société Uber, quant à elle, annonçait la création d’une plateforme visant à partager gratuitement des données de déplacements de ses chauffeurs et clients avec les planificateurs urbains des quatre cent cinquante villes où elle est active .

Ces quelques événements récents montrent toute l’importance que les échanges de données occupent dans nos économies. Ils illustrent aussi les différentes formes que peuvent prendre ces échanges, partage librement consenti (cas d’Uber), vol pur et simple (les selfies sur le Dark Web), ou encore échanges encadrés par des dispositions contractuelles plus ou moins claires (cas de Facebook et d’iRobot).

L’objectif de cette série d’articles est de mieux faire comprendre comment s’organisent les échanges de données. Pour ce faire, je commence par décrire le côté de la demande, en étudiant pourquoi, et comment, les données acquièrent de la valeur. Je considère ensuite le côté de l’offre, en me demandant d’où viennent les données et qui en contrôle la production et la collecte (voir l’article suivant). Il s’agit enfin de comprendre comment l’offre et la demande se rencontrent. Je conclus en réfléchissant aux évolutions que pourraient prendre les échanges de données dans le futur (troisième article).

Le côté de la demande

La demande de données émane d’entreprises, mais aussi d’organisations non commerciales (des villes par exemple) qui cherchent à améliorer leurs pratiques. Il s’agit d’une demande induite car ce ne sont pas les données en elles-mêmes qui sont recherchées mais bien les informations qui peuvent en être extraites et, finalement, les connaissances que génèrent ces informations et qui contribuent à la prise de décisions2. On comprend donc pourquoi la demande de données est un phénomène récent. En effet, la capacité d’accroître la valeur des données en les transformant en informations a considérablement augmenté ces dernières années sous l’effet conjoint de la numérisation et de la « datafication ». La première tendance est la généralisation du format numérique qui permet de stocker, dupliquer et transmettre les données électroniquement bien plus vite et à un coût énergétique nettement moindre. La seconde tendance est la multiplication des traces numériques laissées derrière elles par nos activités, que ce soit par nos ordinateurs et smartphones, par les réseaux sociaux, ou les senseurs de nos objets connectés. À cela s’ajoute le développement d’une nouvelle discipline scientifique, la science des données, qui combine outils mathématiques, statistiques et informatiques pour optimiser l’extraction de connaissances à partir d’ensembles de données.

En résumé, la demande de données est en pleine expansion parce que tant les données disponibles que la capacité de les traiter ne cessent de croître. La valeur des données augmente en effet avec ce qu’il est convenu d’appeler les quatre V des données, à savoir leur volume (d’où le terme de big data, qui suggère des économies d’échelle), leur variété (c’est-à-dire la diversité de leurs sources, qui suggère des économies d’envergure), leur vélocité (c’est-à-dire la rapidité avec laquelle les flux de données peuvent être traités) et, naturellement, leur véracité (ou leur précision, qui détermine la confiance qu’on peut leur accorder).

Les entreprises sont avides de données parce qu’elles cherchent à améliorer leurs processus de production, à développer des produits et services innovants et à mieux cibler leurs clients avec des offres, des publicités et des prix adaptés. Comme chaque entreprise a pour objectif de surpasser ses concurrentes, une course s’engage à qui utilisera au mieux les données disponibles. En découlent deux conséquences importantes pour la demande de données. D’une part, les entreprises ont une disposition à payer beaucoup plus élevée pour des données auxquelles elles ont un accès exclusif que pour des données qu’elles devraient partager avec leurs concurrents. D’autre part, il est possible qu’au sein d’une industrie, les entreprises concurrentes investissent de manière excessive dans l’acquisition et le traitement de données, avec comme effet que les profits des entreprises finissent par baisser. En d’autres termes, comme dans le célèbre dilemme du prisonnier, des entreprises concurrentes gagneraient à restreindre collectivement leur utilisation de données, mais aucune n’y trouve intérêt individuellement.


1. Révélations faites par The Guardian et The New York Times.

2. Thierauf (1999) définit les données comme une collection non structurée de faits et de chiffres, l’information comme des données structurées et la connaissance comme de « l’information à propos de l’information ». Voir THIERAUF R.J. (1999), Knowledge Management Systems, Quorum Books.


Photo credits: (1) janholmquist on Visual Hunt / CC BY-NC; (2) Photo credit: ocd007 on VisualHunt.com / CC BY-ND

No Comments Leave a comment

Submit comment

Your email address will not be published. Required fields are marked *