Для предотвращения вредного влияния эха используются два типа устройств - эхозаградители и эхокомпенсаторы. Первые более простые, принцип их действия состоит в отключении канала передачи при наличии в нем приёма речевого сигнала. Эхокомпенсаторы обеспечивают более эффективное и надёжное подавление вредных эффектов эха за счёт моделирования эхосигнала и вычитания его из принимаемого сигнала.
КОМПРЕССИЯ РЕЧЕВОГО СИГНАЛА
Обязательным этапом преобразования аналогового речевого сигнала является его компрессия, которая позволяет уменьшить требуемую пропускную способность. Его сжатие оказывается возможным благодаря статистическим свойствам аналогового речевого сигнала и его избыточности. Так, уже в первых речевых кодеках типа ИКМ учитывалось, что в речевом сигнале большие амплитуды встречаются гораздо реже, чем малые. Поэтому использование 8-разрядного кодека ИКМ с логарифмической шкалой преобразования амплитуд речи обеспечивает такое же качество речевого сигнала, как и 12-разрядный кодек ИКМ с линейной шкалой преобразования амплитуд. При подобном сжатии достаточно пропускной способности 64 Кбит/c.
В другом, более эффективном кодеке ADPCM ITU-T G.726 с адаптивной дифференциальной ИКМ (АДИКМ) применяется 4-разрядное кодирование, причём кодированию подлежат не сами отсчёты аналогового речевого сигнала, а только разность между текущим отсчётом и некоторой величиной, определяемой на основании анализа нескольких предыдущих отсчётов. Такое кодирование называют дифференциальным кодированием, или линейным предсказанием. Этот метод позволяет уменьшить требуемую пропускную способность до 32 Кбит/c.
Описанные два типа кодеков кодируют огибающую речевого сигнала и называются кодеками формы сигнала (Waveform Codec).
Примерно 15 лет назад появились кодеки с параметрическим кодированием (Source Codec) и более эффективными методами компрессии речи. Используемые в них процедуры сжатия речи генерируют информацию об основных параметрах источника речи и требуют меньшей пропускной способности по сравнению с кодеками ИКМ и АДИКМ.
В зависимости от способа формирования информации об источнике речевого сигнала кодеки этого типа представляют собой различные вариации алгоритмов с линейным кодированием и предсказанием (Linear Predictive Coding, LPC), с линейной предварительной компрессией (Code Excited Linear Prediction Compression, CELP) и с использованием критерия максимального правдоподобия (Multipulse, Maximum Likelihood Quantization, MP-MLQ) (см. Таблицу 1).
Кроме речевых кодеков ITU-T производители оборудования VoIP используют кодеки ETSI, а также собственные кодеки.
В предыдущей статье мы рассматривали показатели качества речи МOS (ITU-Т P.800 и P.830) и R-фактор. Единственный недостаток этих методов - необходимость привлечения многочисленных экспертов, что весьма дорого. К уже перечисленным особенностям R-фактора, методика определения которого называется E-моделью, следует добавить три основных вида оценки R-фактора:
Измерения МOS и R-фактора основаны на использовании реального речевого сигнала, а он оценивается на приёмном конце соединения. Поэтому эти методы называют односторонними методами в реальном времени (Real-Time, Single-Ended).
Кроме методов МOS и R-фактора существует другая группа методов, основанных на передаче по соединению образцов реального или моделируемого (ITU-Т P.50) речевого сигнала, которые на приёме сравниваются с образцами тех же сигналов. Это двусторонние методы без учета реального времени (Non Real-Time, Two-Ended).
К данной группе методов принадлежат:
ПАРЫ ПРЕОБРАЗОВАНИЙ ЦАП-АЦП
В реальных телефонных соединениях большой протяжённости пары цифро-аналоговых (ЦАП) и аналого-цифровых (АЦП) преобразований речевого сигнала вносят свою лепту в ухудшение его качества. Совсем недавно телефонные соединения большой длины (их протяжённость может достигать 25 тыс. км) содержали, как правило, несколько таких пар (ЦАП-АЦП). Дело в том, что такие соединения представляют собой совокупность линий и транзитных коммутационных станций. Процесс модернизации аналоговой телефонной сети осуществлялся (а в некоторых регионах все так и происходит) в два этапа: на первом аналоговые линии заменялись цифровыми, а транзитные коммутационные станции оставались аналоговыми. Каждая станция имеет дело только с исходным речевым сигналом, поэтому в тракте приёма транзитной коммутационной станции цифровой речевой сигнал преобразовывался в аналоговый посредством ЦАП, а в тракте передачи выполнялось обратное преобразование с помощью АЦП.
Каждая такая пара преобразований ухудшает качество телефонного сигнала, причем ухудшение особенно значительно для сжатого речевого сигнала. Так, уже две таких пары ЦАП и АЦП в телефонном соединении с кодеками G.729 приводят к значительному снижению коэффициента MOS. Вместе с тем телефонные соединения с кодеками ИКМ типа G.711 менее чувствительны к ухудшениям, вносимым парами ЦАП и АЦП. Поэтому при проектировании трактов VoIP число таких преобразований должно быть минимальным.
УСТАНОВЛЕНИЕ СОЕДИНЕНИЯ
Установление соединения между абонентами А и Б при организации традиционного соединения ТФОП. Для большей наглядности предположим, что абонентов А и Б обслуживает одна и та же местная АТС, и поэтому они не нуждаются в услугах системы сигнализации SS7.
Итак, абонент А решил позвонить абоненту Б. Процесс установления соединения будет происходить следующим образом.
Затем устанавливается прямое соединение между абонентами А и Б. Обычно местная АТС представляет для этого полнодуплексный цифровой ИКМ-канал DS0 (Digital Service, Level 0) с пропускной способностью 64 Кбит/c.
Примечание. Если Б не является абонентом той же самой АТС, что и А, то местная АТС абонента А просматривает таблицы маршрутизации, чтобы определить возможность установления соединения с абонентом Б. Так, коммутатор местной АТС абонента А может добавить дополнительные цифры (префикс) перед номером телефона абонента Б, чтобы составить полный номер стандарта E.164 и таким образом попытаться установить соединение с абонентом Б.
Установление соединения между абонентами А и Б при организации соединения VoIP. Теперь рассмотрим процесс установлении соединения VoIP между абонентами А и Б.
Предполагается, что на компьютерах абонентов установлены приложения «IP-телефон», совместимые с протоколом H.323.
Теперь Саша и Маша могут говорить друг с другом через пакетную сеть IP.