Sauter au menu Sauter au contenu
PraedictIA

Qu’est-ce que la reconnaissance vocale ?

La reconnaissance vocale est une discipline qui résulte du croisement entre l’intelligence artificielle, la linguistique et le traitement de signal. Elle désigne un large éventail de techniques qui effectuent un traitement du signal acoustique visant à en extraire de la connaissance et de la sémantique.

Cette discipline couvre un important domaine d’applications incluant, entre autres, la reconnaissance vocale, la transcription automatisée à partir de la voix, la traduction automatisée de la parole et la reconnaissance contextuelle à partir du fond sonore qui nous entoure.

Exemple : l’argent virtuel

Pour mieux comprendre ce qu’est la reconnaissance vocale, prenons l’exemple d’une application concrète : la création d’un agent virtuel pouvant comprendre les questions des clients et interagir en conséquence. La majorité des interrogations des clients d’institutions financières peuvent être résolues automatiquement et sans l’intervention d’un opérateur humain. On pourrait, par exemple, vouloir créer un programme informatique destiné à activer automatiquement les cartes bancaires que les clients reçoivent par la poste. En mettant un numéro de téléphone à leur disposition, l’institution financière pourrait assurer l’entièreté du processus, sans aucune intervention humaine.

Tout d’abord, le système poserait à l’utilisateur une série de questions telles que :

  • Quelle est votre date de naissance ?
  • Quel est votre code postal ?
  • Quelle est la dernière transaction que vous avez effectuée avec votre carte de débit ?
  • Quel est le plafond de votre carte de crédit ?

La reconnaissance vocale servirait à transcrire automatiquement les réponses des clients via le téléphone. Lorsque l’identité du client serait confirmée, l’agent virtuel serait en mesure de recevoir ses requêtes vocales et des demandes telles que :

  • Je veux activer une carte bancaire ;
  • J’aimerais consulter mon solde ;
  • Je voudrais savoir quelle est la dernière transaction inscrite sur ma carte de débit ;
  • Je veux parler à un agent.

Une fois la requête transcrite, elle sera analysée sémantiquement pour comprendre son sens au-déla des mots grâce à un système de traitement du langage naturel. Cela pourrait ensuite activer une option prédéterminée dans le système telle que l’activation de la carte de l’utilisateur.

La capacité du système à reconnaître une telle requête améliore sensiblement l’expérience du client en lui évitant d’avoir à écouter l’entièreté des options offertes ou d’attendre qu’un agent soit disponible pour prendre l’appel. L’institution financière, quant à elle, réalise une importante réduction de coûts.