Go to Top

Big Data : Mes données sont partout !

Big Data

On ne peut aujourd’hui quasiment plus se déplacer sans laisser des traces de données. Les téléphones mobiles doivent contacter la tour de téléphonie cellulaire la plus proche et les GPS ne sont d’aucune utilité sans les satellites correspondants. On trouve même aujourd’hui des puces RFID dans certains pneus de voiture. Tous ces dispositifs électroniques laissent derrière eux une multitude de données qui peuvent être facilement exploitées et bien sûr aussi commercialisées. Ce déluge de données a un nom : le big data.

Les scientifiques affirment qu’il est possible d’obtenir de précieux résultats de recherche avec le big data. Les critiques déplorent qu’il soit possible de gagner beaucoup d’argent avec la violation de la sécurité des données.

La technologie du big data permet d’établir des liens insoupçonnés. Ainsi, dans le domaine de la médecine, l’analyse de ces grands volumes de données peut permettre de sauver des vies. Exemple : les infections représentent un grand risque pour les bébés prématurés. Il est donc important de détecter les infections avant qu’elles ne se déclenchent. Les scientifiques canadiens ont collecté de grandes quantités de données sur les bébés prématurés dans lesquelles étaient visibles des motifs évoquant une infection imminente. Grâce à ces informations, un traitement peut être commencé 24 heures avant que les symptômes de l’infection ne se déclarent. Des informations tirées de l’exploitation du big data ont également été utilisées pour la lutte contre la malaria et la polio.

Auparavant, lorsqu’il n’y avait pas tout ce déluge de données, la collecte et l’analyse des données étaient coûteuses, il fallait souvent se satisfaire d’échantillons et on pouvait extraire beaucoup d’informations à partir de peu de données. Toutefois, avec la diminution des coûts de stockage, le volume de données a été multiplié par cent entre 1987 et 2007 (Google traite un pétaoctet de données par jour) et devrait être encore décuplé d’ici 2020 au niveau mondial. De plus, les grandes quantités de données peuvent être traitées avec moins de rigueur. Ainsi, un algorithme plus rudimentaire fournit de meilleurs résultats avec un déluge de données qu’un algorithme plus intelligent avec un plus petit volume de données. Auparavant, il fallait réfléchir à des questions avant de commencer à collecter des données. Aujourd’hui, les données sont d’abord collectées, puis les questions sont posées ; c’est un changement de paradigme.

Cependant, ces nombreuses opportunités entraînent aussi des risques variés. Ainsi, dans plusieurs États américains, le big data est désormais exploité pour lutter contre la criminalité : une analyse des grandes quantités de données est effectuée afin de montrer si une personne peut être mise en liberté conditionnelle et quel est le risque de récidive. Ce n’est pas rien, car cela revient à dire que ce n’est pas nous qui contrôlons le big data, mais le big data qui nous contrôle. Un autre problème tient au fait que tout le monde ne peut pas acquérir des connaissances à partir de collections de données, mais seuls les géants d’internet.

Grâce à l’analyse de grandes collections de données, les entreprises peuvent obtenir des renseignements sur leurs clients sans leur poser des questions. C’est une bonne chose pour l’entreprise, mais il est difficile de trouver des exemples où les résultats du big data sont bénéfiques pour le client. Par exemple, si vous recherchez une voiture, l’analyse du big data peut recommander les véhicules de couleur orange, car ils ressortent le moins souvent dans les statistiques d’accidents. Pour autant, elle ne dit rien de l’état technique d’un véhicule donné.

Laisser un commentaire