Titulaire de la chaire Big Data & Market Insights à Télécom ParisTech, Talel Abdessalem travaille sur la gestion et l’analyse des données massives. Pour lui, leur utilisation n’est pas incompatible avec un comportement éthique. Il s’agit même d’un sujet majeur pour les entreprises…

On observe une forme de défiance du public vis-à-vis du big data. Celle-ci est-elle justifiée selon vous ? 

Ce sujet a fait l’objet d’une très forte médiatisation. Peut-être a-t-elle été trop importante. Le terme lui-même est assez mal choisi, puisqu’il évoque le personnage de Big Brother. Je tiens à souligner que, malgré ce que pense une grande partie de la population, le big data ne se limite pas aux données personnelles. Celles-ci sont d’ailleurs les informations les plus difficiles à obtenir. La plupart des acteurs qui travaillent sur le big data examinent des données publiques ou anonymisées. Pourtant, de nombreuses personnes craignent d’être surveillées. Elles ont peur que les entreprises utilisent leurs données personnelles pour leur vendre des produits dont elles n’ont pas forcément besoin.

 

Le big data est un outil. Tout l’enjeu est de savoir dans quel but il est mis en œuvre.

 

Je pense que les entreprises ont compris que cette utilisation abusive de la donnée n’était pas dans leur intérêt. Elles savent que leurs clients constituent leur capital le plus important. Or, dès que le client estime que la démarche de la société va à l’encontre de son propre intérêt, il s’en détourne.

Le big data est donc avant tout une façon d’améliorer le service proposé. La chaire que je préside est partenaire de groupes comme Yves Rocher ou SNCF. Ces entreprises ont besoin de déterminer les services que le big data permet d’offrir au client. Elles savent, par ailleurs, que l’intégrité est essentielle pour préserver leur image et pour obtenir la confiance du consommateur en raison de la méfiance qui entoure l’utilisation des données personnelles. Le succès du big data passe par le service rendu à l’utilisateur : c’est ma conviction.

On s’aperçoit aujourd’hui que cette stratégie porte ses fruits. Il arrive souvent que les clients choisissent une société en raison de son utilisation pertinente des données. C’est le cas de structures comme Netflix ou Amazon, dont le business se construit notamment sur la recommandation. Dans ce modèle économique, l’entreprise rend service au client en s’appuyant sur ce qu’elle connaît de son comportement. Ces services ont une valeur ajoutée importante, et sont d’ailleurs en train de se rendre indispensables. Les jeunes générations l’ont compris, et sont beaucoup moins méfiantes vis-à-vis de l’utilisation de leurs données.

Le Club informatique des grandes entreprises françaises (Cigref) pense que valorisation des données personnelles et éthique ne sont pas incompatibles. Quel est votre regard sur cette question ?  

Je suis entièrement d’accord. Le big data est un outil. Tout l’enjeu est de savoir dans quel but il est mis en œuvre. On retrouve le même type d’interrogations vis-à-vis de l’analyse du génome humain ou du nucléaire : son utilisation peut servir une fin utile ou néfaste.
C’est pourquoi nous avons besoin de principes d’éthique qui permettent de construire la confiance du consommateur pour le big data. Je crains que la France ne soit en train de prendre du retard dans ce domaine par rapport aux autres pays du monde. Nous avons placé la barre très haut en matière de protection des données personnelles, ce qui n’est pas nécessairement justifié. Il est préférable de responsabiliser les entreprises et de créer des lois qui punissent ceux qui ne respectent pas les règles d’éthique. Cela vaut mieux que de bloquer la situation par des textes qui empêchent les entreprises de se développer et de construire des technologies indispensables à notre économie.

Vos recherches portent également sur la question de la sécurité. Selon David Naccache, chercheur à l’ENS, la sécurité informatique parfaite n’existe pas. Qu’en pensez-vous ?

La sécurité parfaite n’existe certainement pas, mais ça ne veut pas dire qu’il ne faut rien faire pour améliorer notre savoir dans ce domaine et nos outils de protection. Je travaille sur la cybersécurité par les big data, et particulièrement sur la détection de fraudes et d’intrusions. La plupart des systèmes de protection fonctionnent avec un référentiel de signatures. Ils s’appuient sur des outils qui rejettent les requêtes lorsqu’elles sont conformes à une certaine signature. Mais le comportement des hackers change et devient de plus en plus sophistiqué. Nous essayons donc, notamment grâce au machine learning, de détecter cette évolution et adapter automatiquement nos modèles de prédiction. L’enjeu, aujourd’hui, est de parvenir à développer des techniques plus précises et qui passent à l’échelle en traitant à la volé des flux de données massifs.