Главная страница
qrcode

Инд4_Никитин_Ткачев. Алфавит упорядоченный набор символов. Равномерное кодирование


Скачать 294.51 Kb.
НазваниеАлфавит упорядоченный набор символов. Равномерное кодирование
Дата15.07.2021
Размер294.51 Kb.
Формат файлаdocx
Имя файлаИнд4_Никитин_Ткачев.docx
ТипДокументы
#47445
Каталог

Задание 1

Вопрос 1:

Алфавит – упорядоченный набор символов.

Равномерное кодирование – это кодирование, при котором каждый элементарный код имеет одинаковую длину.

Неравномерное кодирование — это кодирование, в котором кодовые слова имеют различную длину.

Разделимое кодирование – код является разделимым тогда и только тогда , когда в графе отсутствуют ориентированные циклы (в том числе и петли).

Первичный алфавит – алфавит , с помощью которого представляется информация до преобразования.

Вторичный алфавит – алфавит , с помощью которого представляется информация после преобразования.

Вопрос 2:

Первая теорема Шеннона, которая называется основной теоремой о кодировании при отсутствии помех, формулируется следующим образом:

При отсутствии помех всегда возможен такой вариант кодирования сообщения, при котором среднее число знаков кода, приходящихся на один знак первичного алфавита, будет сколь угодно близко к отношению средних информации на знак первичного и вторичного алфавитов.

Важно лишь то, что теорема открывает принципиальную возможность оптимального кодирования, т.е. построения кода со средней длиной Кmin(А,В). Однако из самой теоремы никоим образом не следует, как такое кодирование осуществить практически - для этого должны привлекаться какие-то дополнительные соображения.


Из формулы видно, что имеются два пути сокращения Кmin(А,В):

уменьшение числителя - это возможно, если при кодировании учитывается различие частот появления разных знаков в сообщении, корреляции двухбуквенные, трехбуквенные и т.п.;

увеличение знаменателя - для этого необходимо применять такой способ кодирования, при котором появление знаков вторичного алфавита было бы равновероятным, т.е. I(B) = log
Вопрос 3:

Алфавитное кодирование

представление информации в стандартной форме, при которой элементарным синтаксическим единицам языка сообщений (буквам алфавита языка) последовательно сопоставляются кодовые комбинации символов из некоторого заданного алфавита (здесь под информацией понимается линейная запись букв). Примером К. а. может служить известный код Морзе, в к-ром слова кодируются побуквенно, а буквам сопоставлены слова в алфавите трех символов.

Неравномерный код с разделителем

Создается условие, что разделителем отдельных кодов букв будет последовательность 00 (признак конца знака), а разделителем слов-слов - 000 (признак конца слова - пробел). Довольно очевидными оказываются следующие правила построения кодов:

код признака конца знака может быть включен в код буквы, поскольку не существует отдельно (т.е. кода всех букв будут заканчиваться 00);

коды букв не должны содержать двух и более нулей подряд в середине (иначе они будут восприниматься как конец знака);

код буквы (кроме пробела) всегда должен начинаться с 1;

разделителю слов (000) всегда предшествует признак конца знака; при этом реализуется последовательность 00000 (т.е., если в конце кода встречается комбинация ...000 или ...0000, они не воспринимаются как разделитель слов); следовательно, коды букв могут оканчиваться на 0 или 00 (до признака конца знака).

В соответствии с перечисленными правилами строится кодовая таблица для букв русского алфавита


Вопрос 4:

Префиксные коды - это такие коды, в которых ни одна более короткая комбинация не является началом более длинной комбинации, а это позволяет производить однозначное декодирование, даже если последовательность кодов не содержит разделителей между кодами.

Например, код 0111100 декодируется в последовательность символов x1x4x2x1.


Для построения префиксных кодов используется двоичное дерево.

Вопрос 5:

Телеграфный код является одним из кодировки символов, используемой для передачи информации по телеграфии. Азбука Морзе - самый известный такой код. Телеграфия обычно относится к электрическому телеграфу, но телеграфные системы, использующие оптический телеграф, использовались и до этого. Код состоит из ряда кодовых точек, каждая из которых соответствует букве алфавита, цифре или другому символу. В кодах, предназначенных для машин, а не людей, кодовые точки для управляющих символов, таких как возврат каретки, необходимы для управления работой механизма. Каждая кодовая точка состоит из ряда элементов, расположенных уникальным образом для этого символа. Обычно существует два типа элементов (двоичный код), но в некоторых кодах, не предназначенных для машин, использовалось больше типов элементов.

Вопрос 6:



>>> print("Hello, World!")

Hello, World
Вопрос 7:



Задание 2:

Код Хаффмана:



перейти в каталог файлов


связь с админом