Passez-vous trop de temps à parcourir des enregistrements audio à la recherche d’une information clé ? Avez-vous déjà souhaité faire une analyse approfondie de la meilleure formulation pour conclure une vente ? Vous êtes-vous déjà demandé comment la communication programmable et la synthèse vocale pouvaient contribuer à accroître la valeur de vos canaux vocaux ?
Cet article traite de la manière dont Wazo Enterprise Unified Communication peut augmenter la valeur des canaux vocaux. Plus précisément, nous étudierons l’utilisation d’un service de conversion de la parole en texte. Mais vous pouvez utiliser n’importe quel service capable de transformer, d’analyser et d’enrichir vos canaux vocaux.
Déployer la synthèse vocale pour enrichir vos canaux vocaux
ASR (Automatic Speech Recognition), STT (Speech To Text) ou speak engines font tous référence à la même technologie. L’objectif est de pouvoir transformer une voix, un flux ou un fichier en texte. Le texte reste le meilleur support pour exploiter les technologies modernes telles que l’IA, l’indexation et la recherche.
Imaginez que vous puissiez intégrer des fonctions d’accessibilité dans votre application. Par exemple, un appel téléphonique est transcrit en temps réel. Une personne partiellement sourde pourrait lire ce que dit l’interlocuteur et y répondre en tapant. L’autre personne se verrait lire les réponses par un service de synthèse vocale (Text To Speech). Vous pourriez ainsi offrir à tous les utilisateurs une expérience de communication inclusive et fluide.
Imaginez que vous disposiez non seulement de fichiers audio, mais aussi de transcriptions complètes de conversations de centres d’appels injectées dans le fil de discussion Salesforce correspondant. Vous seriez en mesure de rechercher et d’analyser avec précision tout ce que vous souhaitez. Établir des statistiques linguistiques avancées ou faciliter le traitement des questions juridiques. Créer une toute nouvelle définition de l’efficacité opérationnelle.
Autre exemple. Vous recevez trop de messages vocaux et vous n’avez pas le temps de les traiter. Vous pourriez les recevoir transcrits dans un canal Slack ou Microsoft Teams, un courriel ou même un SMS. Permettre à vos collaborateurs d’en mesurer la valeur et de prendre des mesures rapides. En augmentant la collaboration et la productivité de votre équipe.
Wazo Enterprise Unified Communication fournit toutes les API pour construire de tels cas d’utilisation et bien d’autres scénarios de télécommunications. En utilisant une solution tierce comme le constructeur visuel gratuit Node-Red, vous pouvez construire votre propre flux répondant aux besoins de votre entreprise en quelques clics.
Utilisation de la voix programmable pour transcrire les messages vocaux dans un système de messagerie commerciale
Voici le flux de travail qui décrit les différentes étapes pour enrichir votre canal vocal avec Speech to Text :
Tout d’abord, nous recevons un appel. Cet appel sera acheminé vers une boîte vocale.
Ensuite, nos données audio devront être injectées dans notre solution Speech-To-Text qui nous renverra des données transcrites.
Enfin, ces données seront enrichies et formatées pour être envoyées par différents médias, y compris le courrier électronique. Mission accomplie!
Allons plus loin dans la technologie
Dans cet exemple, nous avons utilisé Wazo Enterprise Unified Communication, Slack, MatterMost une passerelle SMS et Gmail.
Tout d’abord, laissez-nous vous donner un aperçu de notre nœud fetch voicemail. Nous utilisons ce nœud pour récupérer les données audio de la boîte vocale de l’utilisateur. Mais il comprend également une WebSocket liée à l’événement « nouveau message audio ». En d’autres termes, il servira de déclencheur pour ce scénario chaque fois qu’un nouveau message vocal apparaîtra dans la boîte vocale de l’utilisateur. Il nous fournira des données audio dans deux formats différents. D’une part, un fichier de message audio et d’autre part, le même message dans un format de données binaires. Ce dernier format sera stocké dans le tampon intégré du Node-RED grâce à notre fonction « Get user ».
Nous injectons maintenant ces données binaires dans notre fournisseur de services de conversion de la parole en texte, qui nous renverra un format de texte.
Enfin, il ne nous reste plus qu’à envoyer ces données à travers nos différents canaux. Pour les canaux e-Mail et SMS, nous demanderons à notre moteur Wazo de nous fournir ces informations en utilisant une méthode GET sur notre API « Confd ». Ensuite, nous utilisons des nœuds tiers pour nous connecter à chaque canal et envoyer nos données transcrites.
Vous avez besoin d’aide pour comprendre les possibilités de l’API de Wazo ? Veuillez trouver notre documentation connexe : ici.
Découvrez d’autres capacités de communication programmables
En utilisant Node-Red, vous êtes en mesure de résoudre des défis commerciaux complexes, en combinant Wazo et d’autres logiciels, sans compromettre les besoins des utilisateurs.
Si vous souhaitez en savoir plus sur les communications programmables, nous avons élaboré d’autres cas d’utilisation pour vous :
- « Concevoir facilement un système d’alerte vocale » – Episode 1
- « Construire une solution d’audioconférence » – Episode 2
- « Transformez vos données de communication en analyses commerciales » – Episode 4
- « Un système SVI adapté à vos besoins – Episode 5
Si vous pensez que la communication programmable peut vous aider à relever vos défis commerciaux, n’hésitez pas à nous contacter.