Construire un système d’audioconférence avec voix programmable

Vous cherchez à mettre en place une solution d’audioconférence ? Ou simplement à intégrer des fonctionnalités de conférence dans vos applications et solutions ? Cet article de blog vous montrera comment construire rapidement cette solution en utilisant des capacités vocales programmables.

L’audioconférence est le moyen le plus simple de mettre les gens en contact. La possibilité de créer rapidement et gratuitement autant d’audioconférences que nécessaire apportera beaucoup de flexibilité et d’évolutivité à votre entreprise. Cela peut également augmenter la valeur de votre solution en intégrant de manière transparente l’audioconférence dans le parcours de l’utilisateur. Ainsi, qu’elle soit nécessaire en tant que solution autonome ou pour soutenir vos processus d’entreprise, l’audioconférence est utilisée partout, tous les jours.

L’audioconférence dans la vie réelle

Imaginez que vous travaillez dans un centre de soins intensifs et que vous devez faire face à des situations d’urgence mettant en jeu le pronostic vital. Cet homme vous appelle. Il est victime d’une attaque cérébrale. Vous avez besoin d’une assistance médicale et d’un service d’ambulance.

Mettriez-vous cet homme en attente ou le transféreriez-vous aux opérateurs médicaux ? Le laisser entendre cette musique agaçante alors qu’il craint pour sa vie ? Quelles sont les autres options qui s’offrent à vous ? Comment pourriez-vous lui apporter l’aide dont il a besoin sans le laisser en attente pendant plusieurs minutes ?

La mise en place d’une audioconférence à la volée pourrait améliorer le parcours de cet utilisateur. Elle vous permettrait de joindre l’assistance médicale et le service d’ambulance tout en le gardant en ligne. Ainsi, vous continuez à le rassurer et à l’informer des mesures que vous avez prises. Enfin, lorsque vous êtes sûr que les experts médicaux sont en mesure de prendre en charge la situation, vous pouvez quitter l’audioconférence sans vous soucier de l’état de l’utilisateur. Vous pouvez quitter l’audioconférence sans rompre le lien entre le patient et les opérateurs médicaux.

Imaginons un autre exemple :

Vous gérez une place de marché ou une plateforme commerciale, vous mettez en relation des acheteurs et des fournisseurs pour un produit ou un service. Mais vous devez parfois gérer des clôtures ou des litiges complexes. Les deux parties doivent se parler et peuvent avoir besoin d’un médiateur ou d’un tiers pour gérer la situation.

En intégrant l’audioconférence dans vos propres applications, vous pourriez permettre à ces deux parties de se contacter et de demander en un clic à un tiers d’intervenir et de les aider.


Wazo Enterprise Unified Communication fournit toutes les API pour construire de tels cas d’utilisation et bien d’autres scénarios de communication. En utilisant le constructeur visuel gratuit Node-Red, vous pouvez construire votre propre flux répondant aux besoins de votre entreprise en quelques clics.

Créer un système d’audioconférence avec voix programmable

Penchons-nous sur cet exemple. Vous souhaitez créer un système de conférence audio à la demande. Inviter les participants à l’aide d’un calendrier. Et pouvoir gérer vos salles à partir d’une interface simple.

Pour les besoins de cet exemple, nous avons construit une interface Web en utilisant Node-red. Mais vous pouvez la construire avec n’importe quelle autre solution ou connecter une solution déjà existante.

Cas d’utilisation flux de travail

Pour déployer un tel cas d’utilisation, vous aurez besoin d’une interface de gestion. Elle permettra d’administrer les audioconférences : créer, gérer et visualiser. À partir de cette interface, vous souhaiteriez également pouvoir saisir l’adresse électronique liée à votre calendrier. De cette manière, vous recevrez l’invitation initiale contenant toutes les références et informations, et pourrez ensuite inviter d’autres participants en quelques clics.

Ces participants recevront l’invitation par courrier. Vous devez définir toutes les informations nécessaires en tant que variables : codes d’accès et codes PIN.

En ce qui concerne l’expérience utilisateur, nous avons proposé deux options pour cet exemple. Mais avec les capacités vocales programmables, vous pouvez la concevoir comme vous le souhaitez. Il n’y a aucune limite.

Vous pouvez donc commencer par ajouter à l’invitation le numéro de téléphone public de la salle de conférence audio que vous venez de créer. De cette manière, le participant devra le composer et se frayer un chemin à travers les identifiants DTMF directement sur son téléphone.

L’autre solution consiste à fournir une interface Web publique, dont l’URL sera indiquée dans l’invitation. Cette interface demandera à l’utilisateur son numéro de téléphone et ses informations d’identification pour déclencher un rappel sur le téléphone qu’il a fourni.

Vous pouvez également imaginer une intégration complète dans votre solution de calendrier existante. Cela signifie que la création et éventuellement la suppression des salles doivent être scénarisées et déclenchées par des événements spécifiques. Le reste du processus resterait inchangé

Programmable use case | Episode #2 – Audio Conferencing (French & English subtitles)

Voyons ce qu’il en est sur le plan technique

Flux de travail de la conférence Node-red

Partie 1 – API vocales programmables

Tout d’abord, concentrons-nous sur les flux « connexion à la chambre », nos trois premières lignes dans le nœud rouge.

Nous avons construit cette fonctionnalité de conférence audio en utilisant les événements et les requêtes API de Wazo. Les « événements » sont des nœuds basés sur WebSocket, ce qui signifie que nous sommes capables d’attraper quelque chose qui se passe dans notre plateforme en temps réel.

Commençons par call_enteredCet événement réagit à chaque appel entrant dans un SDA spécifié. Ensuite, nous avons utilisé l’événement Answer pour commander la prise en charge de l’appel.

Il déclenchera notre prochain nœud d’événement : Appel_réponse suivi d’un nœud lecture pour demander à la plateforme de jouer un message audio spécifique.

Nous utilisons également call_DTMF_receivedqui réagira aux entrées DTMF (nos identifiants, pour accéder à la salle). A la fin de ces premières lignes de flux, on trouve un appel de pont Celle-ci connectera l’appel en cours à la salle de conférence audio ciblée.

Si vous souhaitez mieux comprendre l’API vocale programmable de Wazo, veuillez consulter notre documentation connexe : Référence API.

Chacun de ces événements est une fonction de déclenchement, dans laquelle nous hébergeons quelques lignes de code pour traiter les données ou écrire comment le flux doit réagir.

Par exemple, notre fonction Traitement DTMF fonctionnera chaque fois que des entrées DTMF seront détectées et vérifiera l’exactitude des combinaisons de codes d’accès et de codes PIN.

Partie 2 – Expérience de l’utilisateur

Pour la deuxième partie de ce flux de travail, sur la façon dont nous avons construit l’interface web. Je recommande de lire la littérature sur le tableau de bord Node-red.

Veuillez noter que, comme nous devons stocker des informations, telles que les codes d’accès et les codes PIN ou les adresses électroniques, nous avons utilisé une base de données d’une tierce partie : MongoDB. Vous repérerez facilement les nœuds de la base de données, qui apparaissent en vert.

Vous avez sans doute remarqué notre confd qui permet de transmettre au système des paramètres de création et de suppression.

Les troisième et quatrième rangées de ce flux concernent la création et la suppression de salles. Nous utilisons ici beaucoup de confd soit pour récupérer des informations de Wazo, soit pour en mettre à jour.

Tout d’abord, nous récupérons (GET) le contexte et l’extension disponible dans le plan de numérotation existant, puis nous réservons (POST) une extension pour une nouvelle salle d’audioconférence.

Enfin, nous mettons à jour toutes les informations pour relier une salle de conférence audio à notre extension réservée (PUT). Les informations supplémentaires sont stockées dans une base de données et l’invitation initiale au calendrier est envoyée à l’aide des API MongoDB et Google Calendar.

En ce qui concerne la suppression, dans les trois dernières lignes du flux, nous supprimons simplement la chambre et l’extension (DELETE), ainsi que les informations dans la base de données.

Découvrez les cas d’utilisation des communications programmables

En utilisant node-red, vous pouvez facilement mettre en place des flux de travail combinant Wazo Enterprise Unified Communication avec d’autres logiciels. Vous résoudrez des défis commerciaux complexes, sans faire de compromis sur les besoins de vos utilisateurs.

Si vous souhaitez découvrir d’autres cas d’utilisation des communications programmables, nous en avons élaboré quelques-uns pour vous :

« Construire facilement un système d’alerte vocale » – Episode 1
« Augmenter la valeur de vos canaux vocaux » – Episode 3
« Transformez vos données de communication en analyses commerciales » – Episode 4
« Un système SVI adapté à vos besoins – Episode 5
Et si vous avez des cas d’utilisation que vous ne pouvez pas résoudre avec votre système existant, n’hésitez pas à nous contacter. Ce serait un plaisir d’en discuter et de voir comment nous pouvons vous aider 🙂 .

Des insights de nos experts sur le secteur

Découvrez les dernières informations dans notre bibliothèque de ressources.

Pourquoi choisir une solution programmable?

Le succès de la mission de Wazo s’articule autour de trois principaux piliers : Une approche ouverte, hybride et la programmable. Découvrons-ici ce que Programmable veut dire pour Wazo et les bénéfices que vous pouvez en tirer.