Pourquoi le Big Data ?
La numérisation de tous les secteurs et l’omniprésence d’Internet ont engendré une croissance exponentielle du volume de données généré. Voici quelques exemples parmi les nombreux cas d’usage des technologies de Big Bata :
Transport
La majorité des véhicules modernes, particulièrement les plus connectés (p. ex. Tesla) collectent en permanence un volume important de données servant à détecter des signaux faibles soulignant une éventuelle panne et à diagnostiquer l’état du véhicule en tout temps. Les véhicules sont de plus en plus équipés de fonctionnalités de navigation autonome qui nécessitent des systèmes de gestion et d’exploitation de données volumineuses (images, vidéos, données de radar, nuages de points à partir de LiDAR – Light Detection and Ranging, données de géolocalisation, etc.). Ces données variées, collectées à la volée (vélocité) constituent un cas d’usage parfait pour les systèmes de Big Data; leur bon fonctionnement est vital pour l’exécution des fonctionnalités d’autonomie.
Citons aussi en exemple les applications de navigation routière (p. ex. Waze) qui collectent les données de géolocalisation de plusieurs conducteurs et diverses signalisations (p. ex. travaux, accidents, etc.) pour suggérer, en temps réel, des chemins optimisés et des raccourcis.
Logistique
Les technologies de Big Data constituent le pilier principal de certains leaders de la logistique. Par exemple, le géant Amazon enregistre, chaque seconde, plus de 300 transactions (divers produits, provenance différente, etc.) via ses boutiques à travers le monde. Les données qui transigent par la plateforme d’Amazon sont de taille et de vélocité incomparables. La possibilité d’acheter un produit à quelque endroit que ce soit sur Terre et d’en faire la livraison dès le lendemain est une prouesse technologique basée sur du Big Data. En effet, la chaîne d’approvisionnement d’Amazon (de l’achat jusqu’à la réception du produit) est rigoureusement suivie, gérée et opérationnalisée d’après les données volumineuses.
Marketing et commerce
La majorité des réseaux sociaux et des applications Web d’aujourd’hui doivent leur existence aux technologies de gestion de données volumineuses. Par exemple, d’après le nombre d’utilisateurs et le volume des interactions, les données des réseaux sociaux sont obligatoirement volumineuses, très variées puisque les utilisateurs s’expriment via divers moyens (vidéos, textes, sons, etc.) et d’une vélocité élevée vu la croissance exponentielle qu’engendrent les nouveaux arrivants.
Au-delà des données échangées par les utilisateurs, les réseaux sociaux et les applications Web se basent sur l’utilisation des données comportementales pour améliorer le ciblage publicitaire. Les données publicitaires en ligne occupent un volume immense : les outils de ciblage publicitaire utilisent généralement des cookies (données de navigation Web), qui sont évidemment volumineux, pour associer utilisateurs et publicités afin de capter leur intérêt. Les plateformes publicitaires (Ad exchange) doivent traiter un volume massif de données liées à l’activité de l’internaute, et lui proposer la publicité susceptible de l’intéresser en un temps record (inférieur au temps de chargement d’une page Internet).
Divertissement
Derrière toutes les plateformes de diffusion en ligne (Netflix, Disney+, Spotify, YouTube, etc.) se cache une infrastructure de Big Data extrêmement complexe. La diffusion d’un contenu média nécessite effectivement une gestion sophistiquée permettant à des millions d’utilisateurs de consommer des vidéos en haute résolution ou de la musique en temps réel, sans interruption. Des technologies spécifiques à la diffusion continue (Streaming) ont vu le jour pour faire face à de tels défis.
Industrie manufacturière
L’automatisation des procédés industriels et les objets connectés (IIoT - Industrial IoT) génèrent un volume élevé de données nécessitant des outils de Big Data adaptés pour en extraire de la connaissance. La connexion de machines à des capteurs qui collectent des données en permanence permet d’offrir aux opérateurs des analyses descriptives servant à comprendre l’évolution du rythme de la production, l’état de la machine, etc. Avec ces mêmes données, ils seront aussi en mesure de détecter des anomalies et éventuellement de prévoir l’occurrence de pannes, ce qui permet d’envisager une réduction des arrêts non planifiés et des pertes de matières premières.
Finance et investissements
Les technologies de traitement de données volumineuses sont la base du courtage algorithmique (Algorithmic Trading). La performance de ces algorithmes dépend fortement des processus de collecte et du traitement de données volumineuses structurées (p. ex. l’historique des cours boursiers) et l’exploitation et le forage de données non structurées (p. ex. les nouvelles et les interactions sur les réseaux sociaux).