Xreferat.com » Рефераты по информатике и программированию » Классификация модемных протоколов

Классификация модемных протоколов

ETC фирмы AT&T и MNP10.

3.5.3. Протоколы HST, RHST

Протокол HST (High Speed Technology) разработан компанией U.S Robotics и реализован в ее модемах серии Courier. Это асимметричный дуплексный протокол с частотным разделением каналов. Скорость передачи по обратному каналу может составлять 300 или 450 бит/с. Основной канал обеспечивает скорость передачи 4800, 7200, 9600, 1200, 14400 и 16800 бит/с. Скорость модуляции равна 2400 Бод. Применены сигнально-кодовые конструкции на основе решетчатого кодирования. Протокол HST относительно прост и помехоустойчив, так как отсутствует взаимное влияние встречных каналов передачи и не требуется эхо-компенсация.

За счет использования процедуры ASL (Adaptive Speed Leveling) протокол HST позволяет подстраивать скорость передачи под текущее качество используемого телефонного канала. Данная процедура позволяет не только снижать скорость передачи при ухудшении качества канала связи, но и повышать ее при улучшении параметров телефонного канала. Благодаря этому в каждый момент времени передача данных происходит с максимально возможной скоростью для текущего состояния канала.

Отечественное расширение протокола HST, носящее название RHST отличается от базового варианта следующими характеристиками:

  • максимальная скорость передачи повышена до 21600 бит/с;

  • на скоростях 16800 бит/с и ниже используется более устойчивый вид модуляции сигнала;

  • введен режим расширенного управления скоростью передачи. Протокол RHST поддерживается только модемами Русский Курьер 21600.

3.5.4. Протоколы PEP, TurboPEP

Протоколы семейства PEP (Packetized Ensamble Protocol) разработаны фирмой Telebit и реализованы в ее модемах серий TrailBlaizer (PEP) и WorldBlaizer (TurboPEP). Данные протоколы являются полудуплексными. Согласно этим протоколам для обеспечения высокоскоростной передачи полоса пропускания канала тональной частоты разбивается на множество узкополосных частотных подканалов, в каждом из которых происходит независимая передача порции бит из общего двоичного потока. Такие протоколы называют многоканальными, параллельными или протоколами с множеством несущих (multicarrier).

В протоколе PEP полоса тонального канала разбивается на 511 подканалов. В каждом подканале шириной около 6 Гц данные передаются со скоростью модуляции от 2 до 6 Бод. С помощью КАМ один сигнальный элемент переносит от 2 до 6 бит. Максимальная скорость передачи по протоколу PEP составляет 19200 бит/с.

При установке соединения каждый отдельный подканал тестируется на предмет возможности его использования, выбора скорости модуляции и скорости передачи данных в нем. Протокол предусматривает возможность изменения параметров подканалов или их полного отключения в зависимости от изменяющейся помеховой обстановки в течение сеанса связи. При этом дискретность изменения скорости передачи не превышает 100 бит/с.

Протокол TurboPEP за счет увеличения числа частотных подканалов и количества кодируемых бит одним сигнальным элементом может обеспечивать скорость передачи до 23000 бит/с. В отличие от PEP, протокол TurboPEP предусматривает применение СКК с решетчатым кодом, что увеличивает его помехоустойчивость.

Преимущество данных протоколов, по сравнению с традиционными, основанными на модуляции одной несущей, заключается в малой чувствительности к неравномерности АЧХ канала и влиянию импульсных помех.

3.6. Рекомендации по выбору протоколов модуляции

Основные характеристики рассмотренных выше протоколов модуляции, используемых в модемах для КТСОП представлены в табл. 3.7. Под режимом передачи в данной таблице понимается режим передачи (синхронный либо асинхронный) собственно в канале связи.


Рекомендация

Скорость модуляции, Бод

Скорость передачи, бит/с

Режим передачи

Дуплекс/ полудуплокс

Модуляция

Тип линии

Тип окончания

V. 17 (fax)

2400

14400.1200, 9600,7200

Синхр

ПДП

СКК128.64, 32,16

Комм.

2ПР

V.21

300

300

Любой

ДПЛ

чм

Комм, выд.

2ПР

V.22

600

1200,600

Любой

ДПЛ

ДОФМ, ОФМ

Комм, выд.

2ПР

V.22Di8

600

2400,1200

Любой

ДПЛ

КАМ16, КАМ4

Комм.

2ПР

V.23

1200,600

1200,600

Любой

ДПЛ

ЧМ

Комм.

2ПР, 4ПР

V.26

1200

2400

Синхр.

ДПЛ

ДОФМ

Выд.

4ПР

V.26blS

1200

2400,1200

Синхр.

ПДП

ДОФМ, ОФМ

Комм.

2ПР

V.26ter

1200

2400,1200

Любой

ДПЛ

ДОФМ, ОФМ

Комм.

2ПР

V.27 (fax)

1600

4800

Синхр.

Любой


Выд.

4ПР

V.27bi8 (fax)

1200, 1600

4800,2400

Синхр.

Любой

ОФМ8, ДОФМ

Выд.

2ПР.4ПР

V.27ter (fax)

1200, 1600

4800,2400

Синхр.

ПДП

ОФМ8, ДОФМ

Комм.

2ПР

V.29 (fax)

2400

9600,7200,4800

Синхр.

Любой

КАМ16, 8

Выд.


V.32

2400

9600, 4800. 2400

Синхр.

ДПЛ

СКК32,16, КАМ4, ОФМ

Комм.

2ПР.4ПР

V.32bi8

2400

14400,1200,9600, 7200,4800

Синхр.

ДПЛ

СКК128.64, 32. 16

Комм.

2ПР.4ПР

V.32terbo

2400

19200,16800

Синхр.

ДПЛ

СКК256.512

Комм.

2ПР.4ПР

V.33

2400

14400,12000

Синхр.

ДПЛ

СКК128.64

Выд.

4ПР

V.34

2400, 2743, 2800,3000. 3200.3429

28800,26400, 24000,21600, 19200,16800, 14400,1200, 9600,7200,4800, 2400

Синхр.

ДПЛ

Многомерные СКК

Комм., выд.

2ПР

V.34bis (V.34+)


33600

Синхр.

ДПЛ

Многомерные СКК

Комм., выд

2ПР

Belll03j

300

300

Любой

ДПЛ

ЧМ

Комм.

2ПР

Bell 202


1200

Любой

ДПЛ

ЧМ

Комм., выд.


Bell 208


4800


ДПЛ


Комм.


Bell 212a


1200


ДПЛ


Комм.

2ПР

HST

2400

300, 450/4800, 7200, 9600. 1200, 14400,16800

Синхр.

Асимм. ДПЛ


Комм.

2ПР

Таблица 3.7. Характеристики протоколов модуляции модемов для КТСОП.



Приведенные характеристики протоколов модуляции необходимо учитывать на этапе выбора модема и исходя из задач, для решения которых планируется его использовать. Зная только перечень поддерживаемых модемом протоколов модуляции, можно определить его максимальную скорость работы, а также возможности по передаче факсимильных сообщений и работе по каналам определенного типа.

Как правило, по умолчанию модемы настроены на автоматических выбор протокола модуляции и его параметров. Это происходит на этапе установления соединения. Модемы стараются выбрать наиболее скоростной из совместно поддерживаемых протоколов модуляции. К сожалению, реальная скорость передачи данных часто оказывается слишком низкой из-за частых повторных передач искаженных информационных блоков протоколов исправления ошибок и (или) протоколов передачи файлов. Принудительное снижение скорости или выбор другого протокола модуляции в таких случаях может привести к значительному увеличению реальной скорости передачи.

Для обоснованного выбора требуемого протокола модуляции и соответствующего модема необходимо знать характеристики качества, а точнее дестабилизирующие факторы, используемого канала связи. Основными из них являются отношение сигнал/шум, уровень мощности принимаемого сигнала, дрожание и скачки фазы, смещение несущей частоты, эхо-затухание на ближнем и дальнем концах линии, параметры импульсных помех и др. В табл. 6.12 приведены основные требования к характеристикам канала, необходимые для нормальной работы модемов с протоколами V.22, V.22bis, V.33, V.32bis и V.34.

Узнать перечисленные выше характеристики используемого канала можно только при помощи специальных измерительных приборов, например отечественного анализатора телефонных каналов AnCOM TDA-3 производства НПП "Аналитик-ТС".

Ряд модемов позволяет измерять некоторые из характеристик канала и выводить из значения либо на жидкокристаллическое табло, либо выдавать в компьютер по соответствующей АТ-команде. Это в основном касается профессиональных моделей модемов.

Наиболее информативными в этом смысле из модемов, являются отечественные модемы серии ST-2442 производства НПП "Аналитик-ТС".


Скорость в линии, бит/с

Дестабилизирующий фактор

V.34

V.34biS, V.32

V.22MS, V.22


28800

19200

14400

9800

4800

2400

1200

Допустимое количество транзитов по ТЧ для каналов АСП.п

0...2

0...4

0...6

2...12

Отношение сигнал/шум, дБ

29...42

23...34

>23

>16

>9

14...18

7...10

Чувствительность, дБм

не хуже -30

-38...-50

-42...-56

Дрожание фазы (размах), угловых градусов

0...2

>8

>15

>45

15...50

>45

Скачки фазы, утл. град.

0...2

>5

>15

>60

15...20

>б0

Смещение несущей частоты, Гц

К7...24)

Эхо-сигнал передающего модема

не более 1 -го эхо с задержкой не более 10. „250 мс

не влияет на помехозащищенность

Затухание эхо-сигнала принимающего модема, дБ

>28

>20

>12

>20

>12

Пачки (серии длительностью более 1 с) импульсных помех, шумовые всплески и замирания сигнала, в том числе:

распознавание срыва синхронизации и запроса переустанова соединения (retrain) с возможным понижением скорости

retrain, но возможно и самовосстановление синхронизма

самовосстановление

— допустимая величина кратковременного (2 с) провала или скачка мощности, дБ

не хуже 1

2...10

3...40

6...40

—допустимое кратковременное (2 с) превышение уровня шума над сигналом, дБ

>9

>7

>14

0...40

Таблица 3.8. Диапазоны помехозащищенности модемов



Эти модемы имеют так называемый измерительный интерфейс, базирующийся на стандартном механизме АТ-команд и предоставляющий возможность доступа к внутренней памяти DSP со стороны микроконтроллера. Поставляемая вместе с модемами программа ST24view позволяет в графическом виде отобразить мгновенные и осредненные значения параметров, полученных от модема:

мощность принимаемого и передаваемого сигналов, отношение сигнал/шум, частота несущей принимаемого сигнала, искажения спектра сигнала в полосе приема, групповое время прохождения, ошибки систем тактовой и фазовой синхронизации, значения коэффициентов адаптивного корректора, результаты принятия решения о бодовом значении сигнального элемента.

Полученные тем или иным способом характеристики канала, могут быть использованы для обоснования выбора необходимого модема и его протокола модуляции. При этом могут быть использованы данные из табл. 3.8 и рис. 3.4.

Если вы вынуждены использовать низкий по качеству канал и не можете его улучшить, то резонно будет остановиться на низкоскоростном протоколе и соответственно недорогом модеме.

4 ПРОТОКОЛЫ ИСПРАВЛЕНИЯ ОШИБОК

4.1. Протоколы MNP

4.1.1. Общие сведения

Одним из первых протоколов исправления ошибок стал протокол MNP (Microcom Networking Protocol), разработанный фирмой Microcom. Он оказался настолько удачным, что претерпел девять модификаций и расширений, которые получили название Классов протоколов MNP. Классы 1 — 4 обеспечивают исправление ошибок, классы 6, 9,10 — кроме исправления ошибок, выполняют и другие функции.

MNP1 используется для асинхронного побайтного полудуплексного обмена данными. Он был разработан для того, чтобы устройства с минимальными аппаратными ресурсами могли осуществлять контроль ошибок. Из-за своей чрезвычайно низкой эффективности протокол в современных модемах больше не используется.

MNP2 позволяет исправлять канальные ошибки при асинхронной полнодуплексной передаче данных и требует реализуется в модемах с микропроцессорным управлением. Протокол также характеризуется повышенной избыточностью, поскольку в нем при асинхронном режиме передачи в каждый передаваемый символ включаются стартовые и стоповые биты.

MNP3 обеспечивает обмен данными между модемами по протоколу SDLC (Synchronouse Data Link Control) в синхронном режиме, в то время как обмен данными с компьютером остается асинхронным. Из байт данных, принимаемых от DTE, формируются блоки данных (кадры), называемые в терминах MNP пакетами. Каждый пакет передается как один синхронный кадр второго канального уровня модели OSI. Скорость передачи информации при использовании MNP3 повышается за счет того, что уже не требуется передавать дополнительные стартовые и стоповые биты для каждого байта.

•MNP4 предусматривает возможность изменения размера пакета в процессе процедуры согласования параметров передачи, называемой также процедурой адаптивной сборки пакетов (Adaptive Packet Assembly). Пакет может содержать 32, 64, 128, 192 или 256 байт. При большом уровне шумов передаются пакеты меньших размеров. В результате этого увеличивается вероятность безошибочной передачи пакета данных. По высококачественным каналам пересылаются пакеты больших размеров; при этом уменьшается количество избыточной служебной информации. Управление размером пакета со стороны пользователя часто возможно при помощи АТ-команды Аn.

Протокол MNP4 позволяет повысить скорость передачи за счет оптимизации фазы (режима) передачи данных (Data Phase Optimization), поскольку не требует передавать не изменяющийся заголовок для каждого нового пакета.

Благодаря этому большая часть информационной пропускной способности канала используется для передачи данных.

MNP6 рассчитан на работу со скоростями от 300 до 9600 бит/с. Модем начинает работу на скорости 2400 бит/с и затем изменяет ее в зависимости от типа удаленного модема. Этот протокол предусматривает возможность автоматического переключения из полудуплексного режима в дуплексный и обратно.

MNP9 обеспечивает совместимость с протоколом модуляции V.32 и предусматривает процедуру сжатия, а также повышает эффективность передачи за счет реализации режима селективного повтора искаженных пакетов (ARQ типа SR).

MNP10 предназначен для обеспечения передачи данных при неблагоприятных или изменяющихся условиях на линии связи, характерных, например, для сотовых систем связи. Протокол включает возможность многократных попыток установления связи, динамическую подстройку уровня передачи и размера передаваемого пакета. MNP10 также имеет возможность изменения скорости передачи не только в сторону ее уменьшения, но и в сторону увеличения.


4.2. Протокол V.42

4.2.1. Основные характеристики

С
тандарт V.42, принятый ITU-T в ноябре 1988 года, определяет процедуру LAPM (Link Access Procedure for Modems), схожую по возможностям с MNP4. Преимущества LAPM по сравнению с MNP4 заключаются в повышенной скорости передачи по плохим телефонным каналам и хорошей согласованности с другими стандартами, основанными на протоколе HDLC. Процедура LAPM


Рис. 4.1. Функции DCE без аппаратной коррекции ошибок

очень близка к процедурам LAPB и LAPD, применяемых в сетях Х.25 и в сетях интегрального обслуживания ISDN.

Согласно V.42 требуется реализация как процедуры LAPM, так и протокола MNP4, как альтернативного варианта повышения достоверности. Это означает, что модем V.42 может взаимодействовать с модемами типа MNP4. Однако при таком соединении не будут задействованы все возможности V.42. Во время установления связи модем V.42 проверяет, может ли удаленный модем работать согласно полного протокола V.42 или только по протоколу MNP4. При этом предпочтение отдается протоколу V.42. Таким образом, модем V.42 пытается использовать процедуры коррекции ошибок согласно V.42, и если это не получается, то производится попытка запустить MNP4. Если и эта попытка оказывается безуспешной, устанавливается связь без коррекции ошибок.

В отличие от аппаратуры канала данных без аппаратного исправления ошибок (рис. 4.1), рекомендация V.42 выделяет в функциональной схеме DCE дополнительный блок защиты от ошибок (рис. 4.2).

Согласно V.42 блок управления модема должен определять, поддерживает ли удаленная аппаратура функции исправления ошибок, и координировать согласование соответствующих процедур.

Блок защиты от ошибок предназначен для управления процедурами исправления ошибок. Именно он и реализует протокол связи LAPM.

Р
екомендация V.42 регламентирует также цепи интерфейса V.24, задействованные в процессе работы модемов по протоколу V.42 (рис. 4.3).


Рис. 4.2. Функции DCE согласно V.42




Рис. 4.3. Цепи, работающие при защите от ошибок, где TD — передаваемые данные; RD — принимаемые данные; TDC — синхронизация передаваемых данных; RDC — синхронизация принимаемых данных; RTS — запрос передачи; RFS — готовность к передаче; RSD — детектор принимаемого линейного сигнала из канала данных.


5 ПРОТОКОЛЫ СЖАТИЯ ДАННЫХ

5.1. Основные методы сжатия

Как известно, применение сжатия данных позволяет более эффективно использовать емкость дисковой памяти. Не менее полезно применение сжатия при передачи информации в любых системах связи. В последнем случае появляется возможность передавать значительно меньшие (как правило, в несколько раз) объемы данных и, следовательно, требуются значительно меньшие ресурсы пропускной способности каналов для передачи той же самой информации. Выигрыш может выражаться в сокращении времени занятия канала и, соответственно, в значительной экономии арендной платы.

Н
аучной предпосылкой возможности сжатия данных выступает известная из теории информации теорема кодирования для канала без помех, опубликованная в конце 40-х годов в статье Клода Шеннона "Математическая теория связи". Теорема утверждает, что в канале связи без помех можно так преобразовать последовательность символов источника (в нашем случае DTE) в последовательность символов кода, что средняя длина символов кода может быть сколь угодно близка к энтропии источника сообщений Н(Х), определяемой как:

где p(xi) — вероятность появления конкретного сообщения xi из N возможных символов алфавита источника. Число N называют объемом алфавита источника.

Энтропия источника Н(Х) выступает количественной мерой разнообразия выдаваемых источником сообщений и является его основной характеристикой. Чем выше разнообразие алфавита Х сообщений и порядка их появления, тем больше энтропия Н(Х) и тем сложнее эту последовательность сообщений сжать. Энтропия источника максимальна, если априорные вероятности сообщений и вероятности их выдачи являются равными между собой. С другой стороны, Н(Х)=0, если одно из сообщений выдается постоянно, а появление других сообщений невозможно.

Единицей измерения энтропии является бит. 1 бит — это та неопределенность, которую имеет источник с равновероятной выдачей двух возможных сообщений, обычно символов "0" и "1".

Энтропия Н(Х) определяет среднее число двоичных знаков, необходимых для кодирования исходных символов (сообщений) источника. Так, если исходными символами являются русские буквы (N=32=2 ) и они передаются равновероятно и независимо, то Н(Х)=5 бит. Каждую буквы можно закодировать последовательностью из пяти двоичных символов, поскольку существуют 32 такие последовательности. Однако можно обойтись и меньшим числом символов на букву. Известно, что для русского литературного текста H(Х)=1,5 бит, для стихов Н(Х)=1,0 бит, а для текстов телеграмм Н(Х)=0,8 бит. Следовательно, возможен способ кодирования в котором в среднем на букву русского текста будет затрачено немногим более 1,5, 1,0 или даже 0,8 двоичных символов.

Если исходные символы передаются не равновероятно и не независимо, то энтропия источника будет ниже своей максимальной величины HMAX(Х)=log2 N. В этом случае возможно более экономное кодирование. При этом на каждый исходный символ в среднем будет затрачено n*= Н(Х) символов кода. Для характеристики достижимой степени сжатия используется коэффициент избыточности RИЗБ = 1—Н(Х)/HMAX(Х). Для характеристики же достигнутой степени сжатия на практике применяют так называемый коэффициент сжатия Кcж. Коэффициент сжатия — это отношение первоначального размера данных к их размеру в сжатом виде, — обычно дается в формате К.сж:1 Путем несложных рассуждений можно получить соотношение RИЗБ ≥1—1 /Kcж.

Известные методы сжатия направлены на снижение избыточности, вызванной как неравной априорной вероятностью символов, так и зависимостью между порядком поступления символов. В первом случае для


кодирования исходных символов используется неравномерный код. Часто появляющиеся символы кодируются более коротким кодом, а менее вероятные (редко встречающиеся) — более длинным кодом.

Устранение избыточности, обусловленной корреляцией между символами, основано на переходе от кодирования отдельных символов к кодированию групп этих символов. За счет этого происходит укрупнение алфавита источника, так как число N тоже растет. Общая избыточность при укрупнении алфавита не изменяется. Однако уменьшение избыточности, обусловленной взаимными связями символов, сопровождается соответствующим возрастанием избыточности, обусловленной неравномерностью появления различных групп символов, то есть символов нового укрупненного алфавита. Происходит как бы конвертация одного вида избыточности в другой.

Таким образом, процесс устранения избыточности источника сообщений сводится к двум операциям — декорреляции (укрупнению алфавита) и кодированию оптимальным неравномерным кодом.

Сжатие бывает с потерями и без потерь. Потери допустимы при сжатии (и восстановлении) некоторых специфических видов данных, таких как видео и аудиоинформация. По мере развития рынка видеопродукции и систем мультимедиа все большую популярность приобретает метод сжатия с потерями MPEG 2 (Motion Pictures Expert Group), обеспечивающий коэффициент сжатия до 20:1. Если восстановленные данные совпадают с данными, которые были до сжатия, то имеем дело со сжатием без потерь. Именно такого рода методы сжатия применяются при передаче информации в СПД.

На сегодняшний день существует множество различных алгоритмов сжатия данных без потерь, подразделяющихся на несколько основных групп.

Кодирование повторов (Run-Length Encoding, RLE).

Этот метод является одним из старейших и наиболее простым. Он применяется в основном для сжатия графических файлов. Самым распространенным графическим форматом, использующим этот тип сжатия, является формат PCX. Один из вариантов метода RLE предусматривает замену последовательности повторяющихся символов на строку, содержащую этот символ, и число, соответствующее количеству его повторений. Применение метода кодирования повторов для сжатия текстовых или исполняемых (*.ехе, *.соm) файлов оказывается неэффективным. Поэтому в современных системах связи алгоритм RLE практически не используется.

Вероятностные методы сжатия

В основе вероятностных методов сжатия (алгоритмов Шеннона-Фано (Shannon Fano) и Хаффмена (Huffman)) лежит идея построения "дерева", положение символа на "ветвях" которого определяется частотой его появления. Каждому символу присваивается код, длина которого обратно пропорциональна частоте появления этого символа. Существуют две разновидности вероятностных методов, различающих способом определения вероятности появления каждого символа:

  • статические (static) методы, использующие фиксированную таблицу частоты появления символов, рассчитываемую перед началом процесса сжатия;

  • динамические (dinamic) или адаптивные (adaptive) методы, в которых частота появления символов все время меняется и по мере считывания нового блока данных происходит перерасчет начальных значений частот.

Статические методы характеризуются хорошим быстродействием и не требуют значительных ресурсов оперативной памяти. Они нашли широкое применение в многочисленных программах-архиваторах, например ARC, PKZIP и др., но для сжатия передаваемых модемами данных используются редко — предпочтение отдается арифметическому кодированию и методу словарей, обеспечивающим большую степень сжатия.

Арифметические методы

Принципы арифметического кодирования были разработаны в конце 70-х годов В результате арифметического кодирования строка символов заменяется действительным числом больше нуля и меньше единицы. Арифметическое кодирование позволяет обеспечить высокую степень сжатия, особенно в случаях, когда сжимаются данные, где частота появления различных символов сильно варьируется. Однако сама процедура арифметического кодирования требует мощных вычислительных ресурсов, и до недавнего времени этот метод мало применялся при сжатии передаваемых данных из-за медленной работы алгоритма. Лишь появление мощных процессоров, особенно с RISC-архитектурой, позволило создать эффективные устройства арифметического сжатия данных.

Метод словарей

Алгоритм, положенный в основу метода словарей, был впервые описан в работах израильских исследователей Якоба Зива и Абрахама Лемпеля, которые впервые опубликовали его в 1977 г. В последующем алгоритм был назван Lempel-Ziv, или сокращенно LZ. На сегодняшний день LZ-алгоритм и его модификации получили наиболее широкое распространение, по сравнению с другими методами сжатия. В его основе лежит идея замены наиболее часто встречающихся последовательностей символов (строк) в передаваемом потоке ссылками на "образцы", хранящиеся в специально создаваемой таблице (словаре). Алгоритм основывается на том, что по потоку данных движется скользящее "окно", состоящее из двух частей. В большей по объему части содержатся уже обработанные данные, а в меньшей помещается информация, прочитанная по мере ее просмотра. Во время считывания каждой новой порции информации происходит проверка, и если оказывается, что такая строка уже помещена в словарь ранее, то она заменяется ссылкой на нее.

Большое число модификаций метода LZ — LZW, LZ77, LZSS и др. — применяются для различных целей, Так, методы LZW и BTLZ (British Telecom Lempel-Ziv) применяются для сжатия данных по протоколу V.42bis, LZ77 — в утилитах Stasker и DoudleSpase, а также во многих других системах программного и аппаратного сжатия.

5.2. Сжатие данных в протоколах MNP

Расширяемость MNP при сохранении совместимости с существующими реализациями ярко продемонстрирована в его поддержке Рекомендации ITU-T V.42bis.

В процессе установления соединения передатчик и приемник "оговаривают" использование сжатия данных в процессе. Это выполняется с помощью параметра 9 или 14 блока PDU LR. Параметр 9, который специфицирует сжатие данных MNP5 или MNP7, был расширен, чтобы обеспечить "краткую" форму спецификации V.42bis. Параметр 14 является новым параметром, применяемым для детализации особенностей V.42bis, используемого в данном канале.

Если существует возможность поддерживать MNP5 и (или) MNP7 и V.42bis, передатчик может включить как параметр 9 (сжатие MNP), так и параметр 14 (сжатие V.42bis). Ответственность за выбор типа сжатия данных, который будет использоваться, в этом случае несет приемник. Он возвращает PDU LR, который указывает выбранный тип сжатия данных. Если передатчик и приемник поддерживают несколько методов сжатия, то приемник делает свой выбор в соответствии со следующим приоритетом.

Приемник не включает информацию о поддержке V.42bis в свой PDU LR, если он не принял запрос на V.42bis в LR от передатчика. Если передатчик включил такой запрос в свой PDU LR, но не получил подтверждения, он отказывается от использования сжатия по протоколу V.42bis.

Далее рассмотрим особенности реализации сжатия в протоколах MNP.

Таблица 5.1. Приоритеты выбора метода сжатия

Тип сжатия

Приоритет

V.42bis

Высокий

MNP7

Средний

MNP5

Низкий


5.2.1. Протокол MNP5

Протокол MNP 5 реализует комбинацию адаптивного кодирования с применением кода Хаффмена и группового кодирования. При этом хорошо поддающиеся сжатию данные уменьшают свой исходный объем примерно на 50% и, следовательно, реальная скорость их передачи возрастает вдвое по сравнению с номинальной скоростью передачи данных модемом.

На первом этапе процедуры сжатия используется метод группового кодирования для удаления из потока передаваемых данных слишком длинных последовательностей повторяющихся символов. Этот метод преобразует каждую группу из трех и более (вплоть до 253) одинаковых смежных символов к виду символ и число символов. Поскольку групповое кодирование не связано с большими вычислениями, этот метод особенно хорош для реализации в реальном масштабе времени, в частности, при передаче данных по линиям связи.

Согласно данного метода система группового кодирования проверяет проходящий поток данных. Алгоритм остается пассивным до тех пор, пока в этом потоке не обнаружатся три одинаковых смежных символа. После этого алгоритм начинает счет и удаляет из потока данных до 250 одинаковых следующих друг за другом символов. Счетный байт посылается вслед за тремя исходными символами, и передача продолжается. На рис. 8.2 показан пример группового кодирования потока данных.

Способность метода группового кодирования сжимать длинные последовательности очевидна. Тем не менее, рис. 5.1 иллюстрирует также одну из слабостей данного алгоритма. Кодирование группы из трех символов, наоборот, расширяет поток данных.

Н
а втором этапе сжатия данных протокол MNP5 использует адаптивное кодирование на основе метода Хаффмена, известное также как адаптивное частотное кодирование. Этот способ кодирования основан на предположении,


Рис. 5.1. Групповое кодирование по протоколу MNP5

что некоторые символы будут встречаться в потоке данных чаще, чем другие. Символы, которые встречаются чаще, кодируются с использованием небольшого числа битов. Реже встречающиеся символы передаются с использованием более длинных кодовых последовательностей.

Когда формат передаваемых данных относительно хорошо известен и постоянен, кодовые битовые последовательности, или лексемы, могут быть определены заранее. Однако адаптивный алгоритм может подстраиваться под поток данных путем "обучения" с последующим изменением своих лексем.

В протоколе MNP5 определяются 256 лексем для всех возможных 8-разрядных величин (октетов). Лексема состоит из 3-разрядного префикса (заголовка) и суффикса (тела, или основы), который может включать от 1 до 8 разрядов. Как передатчик, так и приемник инициализируют свои символьно-лексемные таблицы в соответствии с табл. 5.2. Первая и последняя записи


Таблица 5.2. Карта символьно-лексемного кодирования в начале процедуры уплотнения данных

Значение октета (десятичное)

Заголовок лексемы

Тело лексемы

0

000

0

1

000

1

2

001

0

3

001

1

4

010

00

5

010

01

6

010

10

7

010

11

8

011

00

15

011

111

16

100

0000

31

100

1111

32

101

00000

63

101

11111

64

110

000000

127

110

111111

128

111

0000000

254

111

1111110

255

111

11111110


(строки) этой таблицы содержат наиболее и наименее часто встречающиеся октеты, соответственно.

После того как обработан каждый октет, таблица переопределяется, исходя из частоты появления каждого символа. Октетам, которые появляются чаще всего, приписываются наиболее короткие лексемы. На приемном конце лексемы преобразуются в символы. В соответствии с частотой появления тех или иных символов трансформируется таблица приемника. Тем самым осуществляется самосинхронизация, таблиц кодирования и декодирования.


5.2.2. Протокол MNP7

П
ротокол MNP7 использует более эффективный (по сравнению с MNP5) алгоритм сжатия данных и позволяет достичь коэффициента сжатия порядка 3:1. MNP7 использует улучшенную форму кодирования методом Хаффмена в сочетании с марковским алгоритмом прогнозирования для создания кодовых последовательностей минимально возможной длины.


Рис. 5.2. Кодирование при помощи марковского алгоритма прогнозирования и кода Хаффмена

Марковский алгоритм может предсказывать следующий символ в последовательности, исходя из появившегося предыдущего символа. Для каждого октета формируется таблица из всех 256 возможных следующих за ним октетов, расположенных в соответствии с частотой их появления. Октет кодируется путем выбора столбца, соответствующего предыдущему октету (озаглавливающему столбец), с последующим отысканием в этом столбце значения текущего октета. Строка, в которой находится текущий октет, определяет лексему точно так же, как в описанном выше случае кодирования с использованием кода Хаффмена После того как каждый октет будет закодирован, порядок следования записей (октетов) в выбранном столбце изменяется в соответствии с новыми относительными частотами появления октетов.

На рис. 5.2 показан пример кодирования последовательности октетов 3120 в предположении, что перед этим был передан октет 0. Из рис. 5.2. видно, что в столбце, соответствующем предыдущему октету 0, отыскивается запись (строка) октета 3. После этого передается код Хаффмена для этой записи (октета 3) в таблице. Далее в столбце, соответствующем этому только что переданному октету 3, отыскивается строка с записью следующего октета — в данном случае октета 1, и передается код Хаффмена для этой строки и т.д. В этом примере отсутствует иллюстрация адаптивной части алгоритма, изменяющей порядок расположения октетов в каждом столбце.

5.3. Сжатие данных по стандарту V.42bis

В настоящее время методы сжатия данных, включенные в протоколы MNP5 и MNP7, целенаправленно заменяются на метод, основанный на алгоритме словарного типа Лемпеля-Зива-Уэлча (LZW-алгоритме). LZW-алгоритм имеет два главных преимущества:

  • обеспечивает достижение коэффициента сжатия 4:1 файлов с оптимальной структурой;

  • LZW-метод утвержден ITU-T как составная часть стандарта V.42bis. .

Метод сжатия данных LZW основан на создании древовидного словаря последовательностей символов, в котором каждой последовательности соответствует единственное кодовое слово. Входящий поток данных последовательно, символ за символом, сравнивается с имеющимися в словаре последовательностями. После того, как в словаре будет найдена кодируемая последовательность, идентичная входной, модем передает соответствующее ей кодовое слово. Алгоритм динамически создает и обновляет словарь символьных последовательностей.

Р
ассмотрим, например, последовательности А, АУ, БАР, БАС, БИС, ШАГ, ШАР и ШУМ. На рис. 5.3 показано, как эти последовательности будут выглядеть в виде деревьев в словаре стандарта V.42bis. Каждый путь от корневого узла к вершине дерева представляет собой последовательность, которая может быть закодирована с помощью одного кодового слова. Имеющиеся последовательности могут расширяться до тех пор, пока не будет достигнута их максимальная длина. Можно добавлять новые последовательности, причем единственным ограничением является объем используемого словаря.


Рис. 5.3.

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: