電話とCDの音質

1.電話と音楽CDの基本的相違

電話とCD

電話と音楽CDの音質は大きく違いますが何故でしょうか?
電話は経済的に遠くまで音を伝送するため、話が伝われば良い範囲でシステムが設計されています。
音楽CDは遠くまで伝送する必要がなく、音を鑑賞するため耳で聞こえる範囲をカバーしています。


2.音とは

周波数帯域

音は空気を伝わる振動波で、波長(周波数)と振幅(音量)と音色(波形)で表されます。
まず、周波数の帯域は
①人間が話す音声帯域は 350Hz~7KHz
 注:Hz(ヘルツ)=1秒間の波長の回数、1KHz=1,000Hz)
②話が明瞭に聞き取れる範囲は 300Hz~3.4KHz
③人間が聞き取れる周波数帯域は 20Hz~20KHz
 但し、年齢を重ねると13KHz以上はモスキート音として聞こえなくなります。
上記から、電話は②、音楽CDは③を採用しています。
次に音量は小さい音から大きい音の幅(ダイナミックレンジdB)で表され、電話は48dB、 音楽CDは96dBとなっています。
なお、音色(波形)は複数の波の重なりで複雑な波形となります。


3.デジタル化

デジタル化 復元

音声はアナログ信号ですが、アナログ信号は伝送や蓄積再生時に発生する歪や雑音を取り除くことが 困難なため、一旦デジタル化して伝送や蓄積を行い、最後にアナログ信号に戻します。
デジタル化に当り、標本化(サンプリング)と量子化を行います。
標本化はシャノンのサンプリング定理により、元の波形を再現可能な原音の周波数の2倍以上の サンプリング周波数(一定時間毎)で行います。
電話は3.4KHzの2倍以上の周波数の8KHzでサンプリング、 音楽CDは20KHzの2倍以上の周波数の44.1KHzでサンプリングしています。
量子化は振幅の高さを何段階かの数値で表します。段階の数値は0と1のbit(ビット)の数(2のn乗)を用います。
電話の場合はダイナミックレンジ48dBを話が明瞭に聞き取れる程度の8bit(2の8乗)の256段階で量子化します。
音楽CDはダイナミックレンジ96dBを微妙な変化まで再現可能な16bit(2の16乗)の65536段階で量子化します。
上記から1秒間のデータ量は、音声の場合 8KHz×8bit=64Kbps、音楽CDの場合 44,1KHz×16bit=708.7Kbpsとなります。
よって、音声のデータ量はCDの11分の1となり、当然音質は大幅に悪くなります。


4.遅延とエコー

山彦

電話の場合リアルタイムでの双方向同時通信となるため、音質的に色々な問題が発生いたします。
地球の裏側との衛星通信の場合、だいぶタイムラグ(遅延)があり話のやり取りがスムーズに行かないのをTVで良く見ると思います。
一般の電話でも距離により、ある程度の遅延が発生します。
また、距離以外でも携帯電話やIP電話の場合遅延が大きくなります。
それは、電波や伝送路の有効利用のため音声データの圧縮・解凍やデータの伝送待ちで生じます。
電話は双方向通信のため山彦(=エコー)と同様に喋った音が返ってくることがあります。
特に大きな声で喋るとエコーも大きくなります。

遅延とエコー

このエコーは遅延がない場合は側音(喋った音が即耳で聞こえるのは当然)としてあまり気になりませんが、 遅延があるとエコーとして気になります。
このエコーを少なくする仕組み(エコーキャンセラー)がありますが、うまく機能しない場合があります。
また、伝送待ちのバラツキや待ちが長くなると、その音声データ(パケット)は捨てられ音が途切れることになります。