Cette série de trois articles vise à mieux comprendre comment s’organisent actuellement les échanges de données. Dans le premier article, j’ai décrit le côté de la demande, en étudiant pourquoi, et comment, les données acquièrent de la valeur. Dans le deuxième article, je considère le côté de l’offre, en examinant d’où viennent les données et qui en contrôle la production et la collecte. Enfin, je décris ici les différentes modalités sous lesquelles l’offre et la demande se rencontrent. Je m’interroge aussi quant au fait qu’une fraction assez limitée de ces données est échangée. Je propose à cet égard trois explications : le caractère stratégique des données pour les entreprises, la difficulté d’organiser des places de marché décentralisées et le manque de contrôle des individus sur les données qu’ils produisent.
La mise en relation de l’offre et de la demande
Williamson (1991)1 distingue trois façons d’organiser les transactions économiques : la “hiérarchie” organise les transactions au sein d’une entreprise intégrée, le “marché” utilise le mécanisme des prix pour coordonner offre et demande et, entre ces deux extrêmes, les “formes hybrides” reposent sur des contrats spécifiques.
Actuellement, les transactions sur les données s’organisent essentiellement par le mode hiérarchique ou par des formes hybrides. Dans le premier cas, les entreprises collectent directement, ou produisent elles-mêmes, les données dont elles ont besoin. Quand il s’agit de données personnelles, nous avons vu plus haut que la collecte s’appuie sur des contrats de type “opt-out” : pour dire les choses crûment, les entreprises se servent tant que les consommateurs ne les en empêchent pas. Nous avons montré aussi que l’intégration verticale se justifie dès lors que les données permettent d’obtenir un avantage concurrentiel (les entreprises n’ont en effet aucun intérêt à partager les données qu’elles récoltent et moins encore l’information et la connaissance qu’elles en extraient). Les dispositions légales limitant le partage de données personnelles viennent renforcer cette tendance à l’intégration verticale.
Il arrive toutefois que des entreprises trouvent profitable de partager leurs données, afin de mieux coordonner leurs activités. On pense par exemple aux entreprises collaborant à la mise au point de voitures autonomes. Les transactions se basent alors sur des contrats multilatéraux de long terme. Une autre forme de gouvernance hybride est le recours à des intermédiaires spécialisés dans la collecte et le traitement de données. On les appelle “courtiers en données” (“data brokers” en anglais). Les services sur mesure que proposent ces courtiers sont particulièrement prisés par les entreprises qui ne peuvent pas collecter de données par elles-mêmes. En raison des économies d’échelle et d’envergure évoquées plus haut, l’industrie des courtiers en données est dominée par quelques entreprises, en majorité américaines, qui rassemblent des données diverses sur des centaines de millions de consommateurs de par le monde ; citons Acxiom (marketing), Equifax (assurance), Experian (crédit), Corelogic (immobilier) ou Datalogix (finance).
À ce jour, il n’existe pas de “marché des données” à proprement parler. On trouve certes quelques plateformes d’échange de données mais celles-ci sont limitées à une industrie particulière et restreignent considérablement les transactions qui peuvent être effectuées. Ceci s’explique par le paradoxe suivant : comme les données sont stratégiques, la disposition à payer pour des données non exclusives est généralement faible, voire nulle ; mais parce que les données sont non rivales (la consommation par l’un ne réduit pas les possibilités de consommation par l’autre), l’exclusivité est difficile à garantir, singulièrement dans un mécanisme d’échange décentralisé. En outre, il est difficile d’établir rigoureusement la véracité des données, ainsi que leur valeur, en raison de leur unicité (absence de point de comparaison) ou de leur complémentarité (il faut combiner plusieurs bases de données pour extraire de l’information pertinente2).
Conclusion
En résumé, une quantité sans cesse croissante de données est produite, collectée et utilisée mais, en définitive, une fraction assez limitée de ces données est échangée. Nous avons identifié trois explications : le caractère stratégique des données pour les entreprises, la difficulté d’organiser des places de marché décentralisées et le manque de contrôle des individus sur les données qu’ils produisent. Sur ce dernier point, on peut s’attendre à des transformations importantes dans un futur assez proche. En effet, un nouveau texte européen, intitulé Règlement Général sur la Protection des Données (RGPD), vient d’entrer en vigueur ; il impose aux entreprises de donner aux individus davantage de contrôle sur leurs données personnelles. Cela signifie que les entreprises doivent désormais obtenir un consentement explicite et positif des individus pour pouvoir utiliser leurs données et, également, assurer la portabilité de ces données (c’est-à-dire permettre aux consommateurs d’emmener leurs données avec eux lorsqu’ils changent de fournisseur). Comme l’expliquent Peitz et Schweitzer (2017)3, la portabilité empêche le verrouillage et facilite ainsi la concurrence dans l’accès aux données personnelles (à défaut de mettre en place un véritable marché secondaire des données).
Une autre source de changement est le développement de nouveaux intermédiaires qui proposent aux consommateurs des solutions pour gérer activement leurs données personnelles et, potentiellement, les monétiser4. Enfin, le scandale Facebook/Cambridge Analytica (qui ouvre cet article) a suscité de telles réactions des internautes et des pouvoirs publics qu’on est en droit de penser qu’une nouvelle ère commence où les transactions sur les données personnelles seront plus encadrées, plus transparentes et plus respectueuses des individus.
1. WILLIAMSON O.E. (1991), “Comparative Economic Organization: the Analysis of Discrete Structural Alternatives”, Administrative Science Quarterly, 36, 269-296.
2. Pour une analyse plus détaillée, voir KOUTROUMPIS P., LEIPONEN A. et THOMAS L. (2017), “The (Unfulfilled) Potential of Data Marketplaces”, ETLA Working Papers, no 53.
3. PEITZ M. et SCHWEITZER H. (2017), “Datenmärkte in der digitalisierten Wirtschaft: Funktionsdefizite und Regelungsbedarf”, Discussion Paper No. 17-043, ZEW, Mannheim.
4. On les appelle PIMS (Personal Information Management Systems) ou systèmes de gestion des informations personnelles. Les plus connus sont Datacoup, Digi.me et Meeco.
Photo credits: (1) Photo on Visual hunt; (2) Photo credit: Cerillion on VisualHunt / CC BY