"Ce n’est pas la rareté des données qui fait leur valeur, mais leur abondance" ~ .

Par Simon Chignard & Louis-David Benyayer

Dans leur ouvrage, “Datanomics : les nouveaux business models de la donnée” Simon Chignard et Louis-David Benyayer (respectivement Data Editor et chercheur en stratégie) nous apportent un éclairage essentiel pour aborder les nouveaux enjeux économiques liés aux données et mieux comprendre d’où viennent leur valeur.
Ils ont accepté de répondre aux questions du DataLab Emploi.

Dans votre ouvrage, vous abordez le sujet de la valeur que possèdent les données. Quelles sont pour vous leur caractéristique économique ?

Louis-David Benyayer : La caractéristique économique des données est l’une des premières questions auxquelles nous nous sommes confrontées pour essayer de définir ce qui leur donnait de la valeur. Il y a une première façon d’attribuer de la valeur à un produit ou un service, c’est la somme des efforts qui sont requis pour le produire. Appliqué aux données, cela consiste à dire que les données valent la somme des dépenses liées à l’acquisition, au stockage, à la transformation, au transport, à la visualisation etc. Il y a aussi une deuxième façon d’attribuer de la valeur, via la fonction d’utilité. En effet, il peut y avoir une décorrélation entre le prix d’un service et la somme des actions pour l’obtenir. Le SMS par exemple, quand il a été lancé ne coûtait absolument rien à produire, mais il avait une valeur d’utilité suffisamment forte pour que les gens payent pour ce service. Enfin, il y a un autre mécanisme, c’est celui de la rareté. Nous sommes habitués à ce que les choses rares acquièrent plus de valeur, car elles sont plus difficiles à obtenir. Ce qui est intéressant dans le cas des données, c’est que beaucoup d’éléments viennent contredire cette notion, notamment avec les “big data” qui sont, par définition, des données très abondantes. Ce n’est donc pas véritablement la rareté des données qui fait leur valeur, mais au contraire leur abondance. En revanche, même si les données sont abondantes, les robinets pour y accéder, eux, sont rares. Et donc, il y a bien une nouvelle rareté qui se produit qui est celle du point d’accès. Beaucoup d’acteurs construisent une valeur importante de rareté parce qu’ils agissent sur un robinet qu’ils sont les seuls à pouvoir actionner.

Simon Chignard : Nous avons également identifié 3 facettes de la valeur des données. La première prend une forme de matière première. La deuxième de levier, ce qui correspond plus à une valeur d’utilité. Les données ne sont pas marchandées directement, mais leur utilisation va permettre d’améliorer la performance de l’entreprise, soit en lui permettant de vendre plus cher, soit de réduire ses coûts. Et puis la troisième facette, c’est la valeur d’actif. Le fait de disposer et de gérer une quantité importante de données permet à l’entreprise d’avoir ou de prendre une position concurrentielle sur son marché.

Les métaphores autour de la donnée comme matière première sont nombreuses : pétrole, or, diamant, blé… Quelle est pour vous celle qui correspond le mieux ?

Louis-David Benyayer : Aucune, car chacune des métaphores permet de raconter une partie de ce que représente la donnée d’un point de vue économique. Les métaphores du diamant ou du pétrole permettent de raconter l’idée que plus les données sont raffinées, travaillées, analysées, plus elles prennent de la valeur par rapport aux données brutes. Celle du blé, raconte bien les possibilités offertes après une récolte : nous pouvons le transformer tout de suite, ou alors le stocker pour ressemer l’année d’après. C’est donc une valeur de réutilisation.

Simon Chignard : L’une des caractéristiques des données, c’est que précisément, elles ne peuvent être comparées à l’identique avec l’une des matières premières que nous connaissons. Il y a d’ailleurs des travaux en économie qui montrent bien que la donnée pose un problème de conceptualisation majeur, car elle n’est ni un produit, ni un service.

La donnée est-elle la seule ressource de l’économie numérique ?

Simon Chignard : Ce qui nous a le plus frappé en travaillant sur ce livre, c’est qu’il était extrêmement difficile d’isoler séparément chacun des effets de la donnée sur le modèle économique des entreprises du numérique. Leur approche de la donnée est globale à leur modèle économique. La donnée est en fait partout, à tous les stades de ces entreprises. Elle représente un élément fondamental, consubstantiel à la manière dont ces entreprises ont été créées.

Louis-David Benyayer : Quand nous écrivons que la donnée est le carburant de l’économie numérique, c’est même encore trop restrictif par rapport à ce que cela représente pour ces entreprises. Mais il faut faire attention de ne pas tout résumer à la donnée, car la donnée sans algorithmes, sans des savoir-faire informatiques et mathématiques n’est pas grand chose.

L’économie de la donnée a-t-elle une influence sur des secteurs non numériques ?

Simon Chignard : Oui, soit parce qu’il y a des acteurs économiques qui ont une histoire autour de la donnée, par exemple dans le secteur de la distribution, soit parce que les acteurs voient dans la donnée une opportunité d’améliorer la performance de leur modèle économique de base.

Louis-David Benyayer : Il y a beaucoup d’exemples d’entreprises historiques qui exercent des métiers qui ne sont pas nativement numériques, mais qui sont largement impactés par la technologie, mais aussi, et cela va souvent avec, par des nouveaux acteurs qui les amènent à mobiliser les données dans leur stratégie. C’est vrai dans le cas du transport et de la logistique, mais également dans le secteur de la production industrielle. Les fabriquants automobiles font par exemple, depuis un certain temps, une utilisation intensive des données pour des besoins d’amélioration de leur outil industriel.

Quels sont les modèles d’affaires liés à l’open data qui émergent aujourd’hui ?

Louis-David Benyayer : Ce qu’il est fondamental de comprendre, c’est que les données n’ont de valeur que si elles circulent. C’est bien parce que la donnée circule au sein d’une organisation ou d’un écosystème plus ou moins ouvert, qu’elle commence à avoir de la valeur d’utilité ou de la valeur d’usage. Pour le coup, l’open data se place comme un révélateur de la valeur des données. C’est aujourd’hui l’un des meilleurs outils que l’on ait pour faire émerger et augmenter cette valeur.

Simon Chignard : Quand on parle d’open data, il faut distinguer certaines catégories de données. Il y a celles qui créent beaucoup de valeur parce qu’il s’agit de données référentes, très transverses. Toutes les entreprises en France ont par exemple un numéro de Siret et Siren. Typiquement, si ces numéros sont disponibles et donc ouverts, comme le prévoit l’INSEE à partir de 2017, cela permettra de créer énormément de valeur car ce sont des identifiants utilisés dans la plupart des transactions entre entreprises. Ils permettent notamment de relier d’autres données entre elles.

Louis-David Benyayer : L’open data produit plusieurs types de valeur. Au-delà de la création de startups dédiées à l’open data comme Data Publica, ou encoreOpendatasoft, la majeur partie de la création de valeur se fait dans les entreprises déjà existantes qui vont utiliser les données en open data pour prendre de meilleures décisions, pour enrichir leur système d’information, ou pour construire de nouveaux produits.

La fragmentation de l’ouverture des données sur de nombreuses plate-formes pose la question de la coordination entre initiatives privées et initiatives publiques ? Quel est votre vision sur ce sujet ?

Simon Chignard : La question de la coordination liée à la mise à disposition des données peut se faire de différentes manières. Je pense par exemple à des initiatives locales pour créer des régies de données, qui rassemblent en un point unique sur un territoire toutes les données pertinentes, quel que soit l’organisme, public ou privé, qui les produit. Il pourrait exister différents modèles d’économie mixte. Il y a aussi peut être d’autres moyens de coordonner. Je reviens à cette notion de référentiel, finalement si tout le monde utilise la même manière de décrire une personne, un lieux, ou une entreprise, cela permet de coordonner ces jeux de données.

Louis-David Benyayer : Il y a aujourd’hui beaucoup de voies possibles, beaucoup de modèles envisageables, beaucoup d’acteurs qui peuvent collaborer ensemble. L’enjeu qui est partagé par beaucoup c’est de trouver les meilleures façons de collaborer autour d’un sujet. Nous observons que, lorsqu’il s’agit de réunir différents acteurs autour d’une problématique d’ouverture des données, cela s’avère souvent difficile. Il y a rapidement une complexité liée à la taille du problème. Ce qui semble le mieux fonctionner, ce sont des expérimentations, des tests à boucle courte sur des échelles plus réduites, et qui permettre de comprendre comment il est possible de travailler à plusieurs sur la problématique de l’open data. Ces logiques expérimentales, difficiles à concevoir collectivement, sont sûrement l’une des voies les plus productives pour cheminer sur la question.

Certaines données ouvertes aujourd’hui étaient auparavant payantes, et inversement. Ces incertitudes remettent-elles en cause la mise en place de modèles économiques pérennes en matière de données ?

Louis-David Benyayer : Effectivement, il y a un environnement très volatile sur cette notion de modèle économique lié aux données. Mais cette question de dépendance n’est pas propre aux données. Certaines entreprises ont, par exemple, monté des business sur Facebook, et lorsque le réseau social a changé ses conditions d’accès à ses services, se sont retrouvées dans des situations très difficiles. Je pense notamment à certains éditeurs de jeux vidéos.

Simon Chignard : Certaines entreprises, qui décident d’agir en “parasite” en fondant leur modèle économique exclusivement sur l’accès à une source de données, prennent le risque que cet accès deviennent plus coûteux ou exclusif… Il y a une dépendance très forte entre certaines grandes plate-formes comme AirBnB, Twitter, Uber, etc. et des nouveaux acteurs. Cependant, il existe beaucoup de stratégies liées aux données, sur lesquelles le niveau d’incertitude est plus faible. La question fondamentale à se poser est de savoir si la source des données sur lesquelles un modèle économique se fonde est maîtrisée ou non. Si la source n’est pas maîtrisée, il s’agit de la gestion de risque.

Aujourd’hui, de quelles compétences ont besoin les entreprises pour être en capacité de maîtriser et développer les nouveaux modèles économiques liés aux données ?

Louis-David Benyaye : Derrière ces notions liées à la modélisation économique des données, qui peuvent paraître froides, il y a une dimension humaine très importante. La question des modèles économiques liés aux données est à la fois un sujet technique lié à de l’infrastructure informatique, un sujet juridique lié par exemple à la protection des données personnelles ou aux licences d’utilisation de certaines données, mais c’est aussi un sujet de programmation informatique avec des algorithmes, un sujet stratégique, ou encore marketing… Les organisations qui parviennent à faire des données un levier économique, sont celles qui arrivent à synchroniser la totalité de ces compétences là au même moment. Cette synchronisation est difficile pour un certain nombre d’entreprises, car celles-ci sont organisées pour être productives, en silos fonctionnels, géographiques par métier etc. Pour identifier et mettre en oeuvre une stratégie liée aux données, il faut mettre en oeuvre de la transversalité et mobiliser à la fois des compétences techniques, informatiques, à la fois des compétences de datascience, des compétences marketing et stratégiques. Or, ces compétences là, individuellement, ne sont pas toujours natives, et de surcroît pas forcémment habituées à travailler ensemble.

Simon Chignard : Ce que révèle aussi ces questions liées aux données, c’est que nous n’avons pas encore très bien en main la séquence de révélation de valeur. Nous ne savons pas encore dire s’il faut commencer par faire de la datascience pour faire émerger des gains significatifs sur des problèmes précis mais limités, ou bien s’il faut d’abord se poser une question stratégique, et voir comment les données peuvent y répondre… Les entreprises sont aujourd’hui dans ce choix de se dire “comment je tire le fil et comment j’arrive à travailler de manière synchronisée?” Quelle est l’intérêt par exemple de connaître la liste des clients qui vont quitter une entreprise dans les 3 mois qui viennent, si l’entreprise n’est pas en mesure de les retenir ou de mettre en place un processus de rétention : changer le point de contact avec le client, changer le produit, le prix…, des questions qui n’ont rien à voir avec les données.

.

Monday, 14 May 2018