Стеки протоколов

Для предотвращения вредного влияния эха используются два типа устройств - эхозаградители и эхокомпенсаторы. Первые более простые, принцип их действия состоит в отключении канала передачи при наличии в нем приёма речевого сигнала. Эхокомпенсаторы обеспечивают более эффективное и надёжное подавление вредных эффектов эха за счёт моделирования эхосигнала и вычитания его из принимаемого сигнала.

КОМПРЕССИЯ РЕЧЕВОГО СИГНАЛА

Обязательным этапом преобразования аналогового речевого сигнала является его компрессия, которая позволяет уменьшить требуемую пропускную способность. Его сжатие оказывается возможным благодаря статистическим свойствам аналогового речевого сигнала и его избыточности. Так, уже в первых речевых кодеках типа ИКМ учитывалось, что в речевом сигнале большие амплитуды встречаются гораздо реже, чем малые. Поэтому использование 8-разрядного кодека ИКМ с логарифмической шкалой преобразования амплитуд речи обеспечивает такое же качество речевого сигнала, как и 12-разрядный кодек ИКМ с линейной шкалой преобразования амплитуд. При подобном сжатии достаточно пропускной способности 64 Кбит/c.

В другом, более эффективном кодеке ADPCM ITU-T G.726 с адаптивной дифференциальной ИКМ (АДИКМ) применяется 4-разрядное кодирование, причём кодированию подлежат не сами отсчёты аналогового речевого сигнала, а только разность между текущим отсчётом и некоторой величиной, определяемой на основании анализа нескольких предыдущих отсчётов. Такое кодирование называют дифференциальным кодированием, или линейным предсказанием. Этот метод позволяет уменьшить требуемую пропускную способность до 32 Кбит/c.

Описанные два типа кодеков кодируют огибающую речевого сигнала и называются кодеками формы сигнала (Waveform Codec).

Примерно 15 лет назад появились кодеки с параметрическим кодированием (Source Codec) и более эффективными методами компрессии речи. Используемые в них процедуры сжатия речи генерируют информацию об основных параметрах источника речи и требуют меньшей пропускной способности по сравнению с кодеками ИКМ и АДИКМ.

В зависимости от способа формирования информации об источнике речевого сигнала кодеки этого типа представляют собой различные вариации алгоритмов с линейным кодированием и предсказанием (Linear Predictive Coding, LPC), с линейной предварительной компрессией (Code Excited Linear Prediction Compression, CELP) и с использованием критерия максимального правдоподобия (Multipulse, Maximum Likelihood Quantization, MP-MLQ) (см. Таблицу 1).

 

Таблица 1. Некоторые параметры речевых кодеков ITU-T

Примечание.

 

Кроме речевых кодеков ITU-T производители оборудования VoIP используют кодеки ETSI, а также собственные кодеки.

В предыдущей статье мы рассматривали показатели качества речи МOS (ITU-Т P.800 и P.830) и R-фактор. Единственный недостаток этих методов - необходимость привлечения многочисленных экспертов, что весьма дорого. К уже перечисленным особенностям R-фактора, методика определения которого называется E-моделью, следует добавить три основных вида оценки R-фактора:

  • оценка RCQE качества дуплексного соединения VoIP, учитывающая все возможные причины ухудшения качества соединения;
  • оценка R LQE качества соединения воспринимающим речь абонентом, при которой время задержки соединения не учитывается;
  • оценка RNPE качества только сетевой части соединения RNPE, не учитывающая ухудшения речи, вносимой кодеками. Она позволяет выделить ухудшения, вносимые пакетной передачей.
 

Измерения МOS и R-фактора основаны на использовании реального речевого сигнала, а он оценивается на приёмном конце соединения. Поэтому эти методы называют односторонними методами в реальном времени (Real-Time, Single-Ended).

Кроме методов МOS и R-фактора существует другая группа методов, основанных на передаче по соединению образцов реального или моделируемого (ITU-Т P.50) речевого сигнала, которые на приёме сравниваются с образцами тех же сигналов. Это двусторонние методы без учета реального времени (Non Real-Time, Two-Ended).

К данной группе методов принадлежат:

  • Perceptual Speech Quality Measurement (PSQM), приведенный в рекомендации P.861 ITU-T, для тестирования кодеков. Ранее этот алгоритм применялся для оценки качества голоса, хотя он нечувствителен к задержке, потерям, вариации задержке и потере пакетов;
  • Perceptual Evaluation of Speech Quality (PESQ), который также рекомендован P.862 ITU-T для оценки кодеков, однако, в отличие от PSQM, он позволяет оценить и основные характеристики работы реального соединения VoIP, что важно, например, при установке VoIP GSM шлюзов;
  • Perceptual Analysis and Measurement System (PAMS), объединяющий достоинства двух предыдущих методов.
 

ПАРЫ ПРЕОБРАЗОВАНИЙ ЦАП-АЦП

В реальных телефонных соединениях большой протяжённости пары цифро-аналоговых (ЦАП) и аналого-цифровых (АЦП) преобразований речевого сигнала вносят свою лепту в ухудшение его качества. Совсем недавно телефонные соединения большой длины (их протяжённость может достигать 25 тыс. км) содержали, как правило, несколько таких пар (ЦАП-АЦП). Дело в том, что такие соединения представляют собой совокупность линий и транзитных коммутационных станций. Процесс модернизации аналоговой телефонной сети осуществлялся (а в некоторых регионах все так и происходит) в два этапа: на первом аналоговые линии заменялись цифровыми, а транзитные коммутационные станции оставались аналоговыми. Каждая станция имеет дело только с исходным речевым сигналом, поэтому в тракте приёма транзитной коммутационной станции цифровой речевой сигнал преобразовывался в аналоговый посредством ЦАП, а в тракте передачи выполнялось обратное преобразование с помощью АЦП.

Каждая такая пара преобразований ухудшает качество телефонного сигнала, причем ухудшение особенно значительно для сжатого речевого сигнала. Так, уже две таких пары ЦАП и АЦП в телефонном соединении с кодеками G.729 приводят к значительному снижению коэффициента MOS. Вместе с тем телефонные соединения с кодеками ИКМ типа G.711 менее чувствительны к ухудшениям, вносимым парами ЦАП и АЦП. Поэтому при проектировании трактов VoIP число таких преобразований должно быть минимальным.

УСТАНОВЛЕНИЕ СОЕДИНЕНИЯ

Установление соединения между абонентами А и Б при организации традиционного соединения ТФОП. Для большей наглядности предположим, что абонентов А и Б обслуживает одна и та же местная АТС, и поэтому они не нуждаются в услугах системы сигнализации SS7.

Итак, абонент А решил позвонить абоненту Б. Процесс установления соединения будет происходить следующим образом.

  1. Абонент А снимает телефонную трубку (off hook).
  2. Местная АТС посылает абоненту А сигнал готовности к приёму вызова (непрерывный тон).
  3. Абонент А набирает семи- или 11-значный номер.
  4. Местная АТС запоминает и анализирует набранный номер, определяя номер вызываемого абонента Б.
  5. Местная АТС анализирует номер вызываемого абонента, чтобы определить, в состоянии ли она обслужить этот вызов.
  6. Местная АТС определяет абонентскую линию (АЛ) абонента Б.
  7. Местная АТС посылает абоненту Б сигнал вызова.
  8. Этот сигнал слышит и абонент А.
  9. Абонент А поднимает телефонную трубку.

Затем устанавливается прямое соединение между абонентами А и Б. Обычно местная АТС представляет для этого полнодуплексный цифровой ИКМ-канал DS0 (Digital Service, Level 0) с пропускной способностью 64 Кбит/c.

Примечание. Если Б не является абонентом той же самой АТС, что и А, то местная АТС абонента А просматривает таблицы маршрутизации, чтобы определить возможность установления соединения с абонентом Б. Так, коммутатор местной АТС абонента А может добавить дополнительные цифры (префикс) перед номером телефона абонента Б, чтобы составить полный номер стандарта E.164 и таким образом попытаться установить соединение с абонентом Б.

Установление соединения между абонентами А и Б при организации соединения VoIP. Теперь рассмотрим процесс установлении соединения VoIP между абонентами А и Б.

Предполагается, что на компьютерах абонентов установлены приложения «IP-телефон», совместимые с протоколом H.323.


Установление соединения включает следующие этапы.
  1. Пользователь А запускает на своeм ПК H.323-совместимое приложение «IP-телефон».
  2. Пользователь А вводит в строку «вызываемый абонент» (who to call) приложения «IP-телефон» Internet-имя пользователя Б и нажимает клавишу «Ввод».
  3. Приложение «IP-телефон» преобразует Internet-имя пользователя Б в имя хоста DNS и посылает его серверу DNS, который статически сконфигурирован в ПК пользователя А, для определения IP-адреса пользователя Б.
  4. Сервер DNS возвращает пользователю А IP-адрес пользователя Б.
  5. Приложение «IP-телефон» пользователя А, используя IP-адрес пользователя Б, посылает последнему сообщение H.225.
  6. Сообщение H.225 сигнализирует ПК пользователя Б о поступлении вызова.
  7. Пользователь Б нажимает клавишу Aсcept, которая сообщает его приложению «IP-телефон» о необходимости отправки пользователю А сообщения Connect H.225.
  8. Приложение «IP-телефон» пользователя А начинает процесс согласования параметров соединения с ПК пользователя Б по протоколу H.245.
  9. По завершении этого согласования открываются логические каналы.
 

Теперь Саша и Маша могут говорить друг с другом через пакетную сеть IP.