1. 株式会社PALTEK
  2. TECHブログ
  3. 技術情報
  4. RTP/RTCPとは?【第1回】概要編 ~IP電話を支える基礎技術について~

TECHブログ

RTP/RTCPとは?【第1回】概要編 ~IP電話を支える基礎技術について~

RTP/RTCPとは?【第1回】概要編 ~IP電話を支える基礎技術について~

みなさん、こんにちは。
本ブログでは、IP電話のベースの技術となっている「RTP/RTCP」の概要について解説します。

目次

はじめに ~IP電話の動向~

RTP/RTCPの話に入る前に、IP電話の動向について少しお話しします。

ここ数年の社会環境の変化で在宅勤務をされている方が多くいるのではないでしょうか。

在宅勤務においては、ZoomやMicrosoft Teamsなど何らかのWEB会議システムをご利用されていると思います。これらの会議システムは、声(音声)や映像をデジタルデータとしてインターネット上で通信相手とやりとりを行う技術をベースにしています。

また、IP電話機というものを使ったことありますでしょうか。
最近では、自宅に固定電話を持たずにスマートフォン・携帯電話のみという方も多く、家庭用の固定電話はあまり知らないという方もいらっしゃるかもしれません。
しかし、スマートフォンにLINEなどのアプリケーションをインストールして、IP電話として利用されている方も多くいると思いますので、皆さんは日々IP電話を活用されているかもしれません。

固定電話については、
2015年11月に日本電信電話株式会社(NTT)が「固定電話の今後について」を発表し、
PSTN(Public Switched Telephone Network:公衆交換電話網)を2025年に終了すると発表しています。
総務省の資料においても2024年度(2025年1月)にIP網への接続ルート切り替えが完了する予定と書かれています。

つまり、2025年からすべての電話はIP(インターネットプロトコル)で通信されるということになります。

とはいっても、従来のお使いの固定電話機をわざわざIP電話機に交換する必要はありません。従来の固定電話機で通信キャリア会社のメタル収容装置までは従来通りのデータ通信で、その先のコアネットワークからIPで通信されます。

いずれの手段においても、音声や映像はデジタルデータとしてIPで通信されることになります。

ネットワーク階層

ではここから、具体的にRTP/RTCPをテーマに概要について解説していきます。

IPとはネットワーク階層において、下図のOSI ように参照モデルでは第3層(ネットワーク層)にあたり、TCP/IPの階層ではインターネット層にあたります。

TCP/IPの階層でのインターネット層の上位層には、トランスポート層、アプリケーション層があります。トランスポート層はTCP/UDPにあたり、アプリケーション層は、HTTP、TELNET、FTP、そして今回のテーマであるRTP/RTCPにあたります。

RTP/RTCPとは

RTP(Realtime Transport Protocol)

RFC 3550で定義されている
TCP/IPネットワーク上で音声や動画のように連続するデータの流れをリアルタイムに伝送するための通信プロトコル
RFC3550:
RFC(Request for Comments)とは、IETF(Internet Engineering Task Force)によって定められるインターネットに関わる技術情報や仕様、運用規則などが定められた文書群で、RTP/RTCPについてはRFC3550で定められています。

RTCP(RTP Control Protocol)

RFC 3550で定義されている
RTPパケットによる情報転送を制御するためのプロトコルで、RTCPパケットの形で送られて、RTPパケットのデータ転送を補助する役割を果たす

カプセル化

音声や映像などのデジタルデータは、RTP の形式でカプセル化されながらネットワークへ流れます。

VoIP(Voice Over Internet Protocol)アプリケーション

VoIPアプリケーションでは以下の3つの処理を行い、RTP形式のデータとして下位層へ送出します。
・信号のサンプリング(標本化)
・信号の量子化
・信号の符号化

信号のサンプリング(標本化)

人の声はアナログ信号です。
デジタル信号へ数値化するためにアナログ信号から一定間隔で信号を抽出します。
これをサンプリングといいます。サンプリングは1秒間に8000回(8kH)というサンプリングレートで実施します。

信号の量子化

サンプリングした信号を量子化して数値化します。

信号の符号化

量子化により求められた値を符号化によって0と1の2進数データへ変換します。符号化により音声をデジタル化することをコーデック(codec)といいます。
符号化の方式は、PCM(G.711)、ADPCM(G.726)、CS-ACELP(G.729)、他のようにいくつもあります。


VoIPアプリケーション処理部は、DSPやアプリケーションプロセッサとその上で動作するソフトウェアで実現されます。

おわりに

いかがでしたでしょうか。
次回(第2回)は、RTP/RTCP のヘッダーについて説明します。

■参考文献

VoIP関連のDSP、システム・オン・チップ(SoC)などに関する情報は以下よりご確認ください。

詳細はこちら

このブログのシリーズ

関連ブログ