Sauter au menu Sauter au contenu
PraedictIA

Qu’est-ce que les modèles génératifs ?

En apprentissage machine, il existe principalement deux sous-catégories de modèles : les modèles apprenants discriminatifs et les modèles apprenants génératifs.

La majorité des modèles utilisés sont discriminatifs. Que ce soit pour la classification, la segmentation ou la régression, il s’agit de modèles d’apprentissage machine ayant comme principe de base d’associer un enregistrement en entrée (x) à une valeur de sortie (y). Par exemple, un modèle où une image x en entrée est classifiée par le modèle dans une classe prédéterminée (de chats, de chiens, de véhicules, etc.). Peu importe la technique d’apprentissage (par un réseau de neurones artificiels ou un arbre de décision), le principe de fonctionnement des modèles discriminatifs est le même : associer une variable d’entrée à un label de sortie bien spécifique.

Les modèles génératifs représentent une catégorie à part. Contrairement aux modèles discriminatifs qui associent les valeurs d’entrée à des étiquettes de sortie, ils ont pour objectif de générer de nouvelles données suivant des règles et des conditions spécifiques. Une explication simplifiée serait que les modèles génératifs sont capables d’apprendre les caractéristiques communes d’une collection de données et ensuite, de générer des données similaires. Au moment où ces modèles associent un enregistrement x à une étiquette y, les modèles génératifs génèreront un autre enregistrement x’. Par exemple, supposons un enregistrement x (l’image d’un chat) associé à une étiquette y (la classe chats). Un bon modèle génératif sera capable de générer une image de chat x’ si réaliste qu’un modèle discriminatif pourra l’associer à une étiquette y (classe de chats).

Il existe une multitude d’utilités pour les modèles génératifs. Historiquement, comme ils étaient difficiles à entraîner, les cas d’usage opérationnels étaient limités. Avec l’apparition de nouvelles approches telles que les réseaux antagonistes génératifs (GANs ou Generative Adversarial Networks), des applications novatrices ont vu le jour et d’autres usages ont été imaginés.

Les réseaux adversariaux (GAN)

Étude de cas

Imaginons que nous concevions un programme informatique qui permet de générer des cartes géographiques simplifiées et intuitives à partir d’images de satellites, permettant de transformer une image satellitaire en entrée en une carte à deux dimensions à l’instar des cartes de géolocalisation (Google Maps, Apple Maps, etc.). Évidemment, sans une approche automatisée du travail de cartographie terrestre, générer une carte interactive de cette taille serait une tâche colossale!

Cartographie générée à partir d’images satellitaires.

Pour générer la carte, nous utiliserons donc un modèle d’apprentissage machine, plus particulièrement un réseau de neurones antagonistes génératif (un type particulier de modèle génératif). Supposons que la carte géographique est constituée d’un ensemble d’images de forme rectangulaire, collées les unes à côté des autres. Un balayage satellitaire produira une collection d’images couvrant une zone particulière. Pour entraîner le modèle génératif à produire des images cartographiques similaires, on lui fournira en même temps, à partir des mêmes coordonnées, une collection d’images satellitaires et d’images cartographiques. Une fois entraîné, ce modèle sera capable de générer une image cartographique x’ à partir d’une image satellitaire x.