Le protocole SIP, pour Session Initiation Protocol, est un des protocoles utilisé en VoIP pour assurer le bon acheminement de vos communications. Il est un des protocoles essentiels et les plus connus de la téléphonie IP. 

Dans cet article, nous allons tâcher de tout vous expliquer sur : 

Le protocole SIP, définition

Le protocole SIP est un protocole de signalisation coeur des systèmes de voix sur IP. Développé par l’IETF et décrit dans le RFC 3261, lui même complété par le RFC 3265, il s’est très rapidement imposé comme un standard grâce à son côté ouvert, ses similarités avec le protocole HTTP et sa pertinence dans les systèmes VoIP. Il ne se limite cependant pas à la téléphonie IP puisqu’il est aussi largement utilisé dans la réalité virtuelle et les jeux vidéos en ligne.  

Le protocole SIP est utilisé pour établir, modifier et terminer une session entre deux ou plusieurs participants d’une communication multimédia. Toute négociation d’une session de transfert audio, vidéo, de votre statut ou d’image peut donc être assurée par ce protocole. 

Il se charge de définir l’identité des participants, de les authentifier et d’indiquer leur localisation afin qu’ils puissent être joints sur le réseau IP. Le protocole SIP encapsule des messages SDP, pour Session Description Protocol, afin d’indiquer les types de canaux et les codecs disponibles pour établir la session de communication. 

Le protocole SIP permet ainsi un échange d’informations entre le téléphone SIP, le serveur SIP de l’appelant et le réseau afin de permettre d’établir la connexion avec le(s) bon(s) interlocuteur(s). C’est lors de cet échange que vous saurez si votre correspondant est par exemple disponible ou occupé, ou que vous avez fait un faux numéro et qu’il n’existe pas. 

Protocole SIP entête
Exemple d’une entête SIP – INVITE

Les données du protocole SIP sont transmises en utilisant le protocole TCP, pour Transmission Control Protocol, ou UDP, User Datagram Protocol. Il est également possible d’assurer le chiffrement et la sécurisation du protocole SIP en utilisant le TLS, pour Transport Layer Security ou SSL, pour Secure Sockets Layer.

Le protocole SIP n’assure pas le transport du média mais simplement la description de la session. En effet, une fois que les échanges SIP se concluent par un “200 OK”, alors le protocole de transport vient prendre le relai. Le transport des médias audios et vidéos est assuré par le protocole RTP, pour Real-time Transport Protocol ou sa version sécurisée, le SRTP, pour Secure Real-time Transport Protocol. 

La différence entre SIP & H.323

Le protocole H.323 est l’ancêtre du protocole SIP. Il regroupe un ensemble de protocoles de communication de voix, d’images et de données sur le protocole internet (IP). 

Tout comme le protocole SIP, le protocole H.323 est en charge de la signalisation et de la négociation sur les moyens à utiliser pour l’échange de communications. Il comprend également le protocole de transport RTP pour assurer l’acheminement du média. Les similarités entre ces deux protocoles ne s’arrêtent pas là puisqu’ils utilisent bon nombre de codecs audios et vidéos communs dont notamment les codecs G.711 et G.729. 

Il est cependant progressivement abandonné au profit du protocole SIP qui se veut : 

Les principaux constructeurs d’équipement de téléphonie ont abandonné le protocole H.323 au profit du SIP qui est aujourd’hui le protocole standard de la téléphonie IP. 

Les ports utilisés par le protocole

Afin de permettre la bonne négociation du média, il convient d’ouvrir les ports 5060 pour permettre les échanges SIP. La version sécurisée du protocole SIP, le SIP-TLS aussi appelé SIPS, utilise quant à lui le port 5061.