Тема Алфавитный подход к определению количества информации



Скачать 122.48 Kb.
Дата04.08.2016
Размер122.48 Kb.
ТипЗадача
Домашнее задание по информатике для групп 11, 15

Преподаватель Новожилова В.И.
Тема 1. Алфавитный подход к определению количества информации.

Умение подсчитывать информационный объем сообщения.

По этой теме нужно научиться решать несколько типов задач:


  1. первый тип – задан информационный объем сообщения в битах. Требуется найти объем сообщения в байтах или мегабайтах:

Уровень сложности – базовый.

Вид деятельности – 1-воспроизведение представлений или знаний

Примерное время исполнения – 1 минута.

  1. второй тип – Задано максимальное число, которое нужно закодировать минимальным количеством бит. Требуется подсчитать информационный объем сообщения, которое содержит заданное количество записей:

Уровень сложности – повышенный

Вид деятельности – 3- Применение знаний и умений в новой ситуации

Примерное время исполнения – 3 минуты.



Примеры решения задач

Задача 1 типа. Получено сообщение, информационный объём которого равен 32 битам. Чему равен этот объём в байтах?

Алгоритм решения задачи:

В каждом байте 8 бит, делим 32 на 8, получаем 4 байта.



Справочник по теории

На экзамене по информатике нельзя пользоваться калькулятором, поэтому нужно выработать навык быстрого вычисления результата. Для решения задач первого типа нужно знать наизусть таблицу перевода величин:

1 байт = 8 бит = 23 бит

1 Килобайт (Кбайт) = 1024 байта = 210 байт

1 Мегабайт (Мбайт) = 1024 Кбайт = 210 Кбайт = 220 байт.
Задача 2 типа. В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?

Алгоритм решения задачи:

Задача решается в два этапа:

1) Вычислить минимально возможное количество бит k, которое требуется для кодирования номера участника соревнований;

2) Вычислить информационный объем сообщения из 70 номеров.

Максимальное число, которое должно быть закодировано, это 119. Из формулы Хартли N=2k находим k = [log2 N]+1, где [log2 N] – целая часть от логарифма N по основанию 2. При этом мы отбрасываем дробь – часть бита, что приведет к потере информации при кодировании, значит, к результату нужно прибавить целый бит.

Подставляем в формулу N=119, находим k=7. При этом не обязательно брать логарифм и пользоваться формулой, достаточно найти такое 2k < N и определить k. Это значит, что номер каждого участника соревнований кодируется 7 битами. Для кодирования номеров 70 велосипедистов потребуется 7*70=490 бит,



Справочник по теории

За единицу количества информации принимается такое количество информации, которое содержит сообщение, уменьшающее неопределенность в два раза. Такая единица названа бит. При этом мы рассматриваем информацию с точки зрения содержания, ее понятности для человека.

Однако при хранении и передаче информации с помощью технических устройств целесообразно отвлечься от содержания (смысла), а рассматривать ее как последовательность знаков. Набор символов называется алфавитом, количество символов в алфавите – его мощность. Если считать, что появление каждого символа в сообщении равновероятно, и связать количество возможных событий (длину сообщения) и количество информации в нем по формуле Хартли N=2i, то можно найти количество информации, которое несет каждый символ: i = [log2 N]+1, где [log2 N] – целая часть от логарифма N по основанию 2. Взяв целую часть от логарифма, мы отбрасываем дробь – часть бита, что приведет к потере информации при кодировании, значит, к результату нужно прибавить целый бит.

Количество информации, которое содержит сообщение, закодированное с помощью знаковой системы, равно к5оличеству информации, которое несет один знак, умноженному на количество знаков.


Задача 3 типа. В некоторой стране автомобильный номер длиной 6 символов составляют из заглавных букв (используются только 33 заглавных буквы) и десятичных цифр в любом порядке.

Каждый такой номер в компьютерной программе записывается минимально возможным и одинаковым количеством бит (при этом используется посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством битов).

Определите объем памяти, отводимый этой программой для записи 100 номеров.

Алгоритм решения задачи:

Алфавит содержит 33 буквы и 10 цифр, всего 43 символа. По условию задачи каждый символ кодируется одинаковым минимально возможным количеством бит, значит, для кодирования одного символа в номере машины нужно использовать 6 бит, т.к. 32<43<64=26. В номере 6 символов, поэтому для кодирования одного номера нужно 36 бит, что составляет 5 байт, округление производится с избытком до целого количества байтов. Для кодирования 100 номеров потребуется 500 байт.


Задание по теме «Алфавитный подход к определению количества информации»

  1. Для передачи секретного сообщения используется код, состоящий из десятичных цифр. При этом все цифры кодируются одним и тем же (минимально возможным) количеством бит. Определите информационный объем сообщения длиной в 150 символов.

  2. В некоторой стране автомобильный номер длиной 7 символов составляют из заглавных букв (используются только 22 различных буквы) и десятичных цифр в любом порядке. Каждый такой номер в компьютерной программе записывается минимально возможным и одинаковым целым количеством байт (при этом используют посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством бит). Определите объем памяти, отводимый этой программой для записи 50 номеров.

  3. Для регистрации на сайте некоторой страны пользователю требуется придумать пароль. Длина пароля – ровно 11 символов. В качестве символов используются десятичные цифры и 12 различных букв местного алфавита, причем все буквы используются в двух начертаниях: как строчные, так и заглавные (регистр буквы имеет значение). Под хранение каждого такого пароля на компьютере отводится минимально возможное и одинаковое целое количество байтов, при этом используется посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством битов. Определите объем памяти, которое занимает хранение 60 паролей.

Тема 2. Умение кодировать и декодировать информацию. По этому разделу нужно уметь решать четыре вида заданий, примеры разбора которых приведены ниже.


  1. Тип первый – Заданы двоичные коды 5 букв латинского алфавита и двоичная строка. Требуется определить слово, которое закодировано этой строкой.

  2. Тип второй - Заданы двоичные коды 5 букв латинского алфавита и 4 двоичных строки. Требуется определить строку, которую можно декодировать.

  3. Тип третий - Заданы двоичные коды 4 букв русского алфавита(или 5 букв английского алфавита), с помощью этого кода записано слово, получена двоичная строка, которая записывается 16-ричным кодом. Требуется определить, какое 16-ричное число получится в результате такого преобразования.

  4. Тип четвертый – заданы коды четырех русских букв. Из предложенных четырех вариантов выбрать код пятой буквы, чтобы код стал префиксным.

Все задачи имеют:

Уровень сложности – базовый.

Вид деятельности – 3 - Применение знаний и умений в новой ситуации.

Время решения – 2 минуты.

Справка по теории

Понятие кода. Функцией кодирования называется отображение множества символов алфавита 1 во множество символов алфавита 2. Математически это записывается в виде F : Алф1 → Алф2, при этом некоторой цепочке символов из алфавита Алф1 сопоставляется некоторая цепоч­ка символов из алфавита Алф2. Результат этого отображения - цепочка символов из алфавита 2, называется кодом исходной цепочки из символов алфавита 1.

Можно выделить 4 типа кодирования:



  1. Символ → в символ, при этом длина первого и второго алфавитов одинакова. Код F в этом случае заменяет символы алфавита Алф1 символами алфавита Алф2 по некоторому закону.

  2. Символ → в слово, при кодировании один символ первого алфавита заменяется цепочкой символов второго алфавита. Это один из самых распространенных способов кодирования. Например, двоичное кодирование именно такого типа, одному символу языка программирования сопоставляется цепочка нулей и единиц.

  3. Слово в символ, при этом кодировании цепочке символов из алфавита 1 сопоставляет один символ алфавита 2..

  4. Слово в слово, при этом код имеет вид цепочки символов из соответствующих алфавитов.

Пример. Пусть Алф1 = {a, b, c, d}, а Алф2 = {0, 1}. Тогда примером кода типа 2 может являться код, который символ ‘а’ переводит в символ ‘0’, (будем писать: а → 0), ‘b’ → ‘01’ (b - в цепочку символов 01), ‘с’ →’10’, ‘d’ → ‘1’.

Допустим, что слово s = 01101010 было получено в результате коди­рования по данному правилу. Нам хотелось бы узнать, какое слово из символов алфавита Алф1 было переведено в слово s. Для этого нужно выполнить действие, называемое декодированием, или дешифровкой. В рассматриваемом примере кода возможны два варианта де­шифровки кода. Слово ‘addbba’ кодируется словом s, и слово ‘bccc’ так­же кодируется словом s. Мы столкнулись с проблемой неоднозначности декодирования, когда две разные исходные цепочки в Алф1 имеют один и тот же код в Алф2. Для успешной дешифровки необходимо, чтобы коды допускали однозначное декодирование.



Определение. Код называется префиксным, если никакое кодовое слово не явля­ется началом никакого другого кодового слова.

В примере слово, состоящее из одного символа 0, является началом другого слова 01. Сле­довательно, рассмотренный код не является префиксным кодом.



Утверждение. Префиксный код всегда может быть однозначно де­кодирован.

Если кодовая цепочка дешифруема, то минимальная по длине начальная цепочка, являющаяся кодом некоторого символа, позволяет восстановить первый символ исходной цепочки. В силу определения префиксного кода никакая более длинная начальная цепочка не может быть кодом друго­го символа. Часть кода, оставшаяся после отделения кода найденного символа, дешифруется так же.



Пример. Пусть Алф1 = {a,b,c,d}, Алф2 = {0,1}. Рассмотрим код F такой, что

а → 0, b → 101, с → 110, d → 1110.

Рассмотрим слово s = 01101010, состоящее из символов алфавита Алф2. Код F является префиксным, поэтому слово s однозначно декодируется, а именно: acba.

При преобразовании информации из одного вида в другой количе­ство информации не возрастает.



Задачи первого типа


A

B

C

D

E

000

110

01

001

10
Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв   из двух бит, для некоторых - из трех). Эти коды представлены в таблице:

Определить, какой набор букв закодирован двоичной строкой 1100000100110



Алгоритм решения задачи:

В данном случае приведенный код является префиксным, поэтому следует разделить заданную строку в соответствии с кодами и сравнить с ответом.

110 = b; 000 = a; 01 = c; 001 =d; 10 = e.

Задачи второго типа


В

К

А

Р

Д

000

11

01

001

10
Для 5 букв русского алфавита заданы их двоичные коды (для некоторых букв   из двух бит, для некоторых – из трех). Эти коды представлены в таблице. Из четырех полученных сообщений в этой кодировке, только одно прошло без ошибки и может быть корректно декодировано. Найдите его:


1)

110100000100110011

2)

111010000010010011

3)

110100001001100111

4)

110110000100110010
Алгоритм решения задачи:

В данной задаче задан префиксный код, поэтому можно однозначно раскодировать это сообщение. Код называется префиксным, если код каждого символа алфавита не является началом кода другого символа. Копируем на черновик варианты ответа и делим строку на части в соответствии с заданными кодами.



1)

11-01-000-001-001-10-011= нет последнего кода,

2)

11-10-10-000-01-001-001-1= нет последнего кода

3)

11-01-000-01-001-10-01-11=расшифровано

4)

11-01-10-000-10-01-10-01-0=проверка - нет последнего кода

Задачи третьего типа

Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБВА и записать результат шестнадцатеричным кодом, то получится:




1)

138

2)

DBCA

3)

D8

4)

3120

Алгоритм решения задачи:

Сначала нужно составить на черновике таблицу кодировки в явном виде: А=00, Б=01, В=10, Г=11. Далее следует закодировать заданную строку: ГБВА=11011000. Получили целое натуральное число в двоичной системе счисления, его нужно перевести в 16-ричную систему счисления. Коэффициент кратности между этими системами счисления равен 4, справа налево делим число на группы по 4 цифры, получили две группы цифр 1101-1000, записываем каждую группу одной цифрой 16-ричной системы счисления. 1101=8+4+1=13=D, 1000=8.



Ответ №3

Задачи четвертого типа

Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приемной стороне канала связи. Использовали код А-1, Б-000, В-001, Г-011. Укажите, каким кодовым словом должна быть закодирована буква Д. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования.



1)

00

2)

01

3)

11

4)

010

Алгоритм решения задачи:

Требование наименьшей длины кодового слова заставляет при решении задач рассмотреть сначала образцы длиной 2. Слово «00» является началом кода буквы Б, «01» - началом кода буквы Г, «11» - содержит код буквы А. Требованию однозначной расшифровки удовлетворяет только код под номером 4.



Ответ №4


A

B

C

D

E

000

01

100

10

011
Задание по теме «Кодирование и декодирование»

  1. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв   из двух бит, для некоторых - из трех). Эти коды представлены в таблице:

Определить, какой набор букв закодирован двоичной строкой 0110100011000

1)

EBCEA

2)

BDDEA

3)

BDCEA

4)

EBAEA

2) Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБАВ и записать результат шестнадцатеричным кодом, то получится:

1)

D2

2)

132

3)

3120

4)

DBАC

3) Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов БАВГ и записать результат шестнадцатеричным кодом, то получится:

1)



2)

411

3)

BAСD

4)

1023

4) Для передачи по каналу связи сообщения, состоящего только из символов А, Б, В и Г, используется неравномерный (по длине) код: А-00, Б-11, В-010, Г-011. Через канал связи передается сообщение: ВАГБГВ. Закодируйте сообщение данным кодом. Полученную двоичную последовательность переведите в шестнадцатеричную систему счисления. Какой вид будет иметь это сообщение?

1)

АD34

2)

43DA

3)

101334

4)

САDBCD

5) Для передачи по каналу связи сообщения, состоящего только из символов А, Б, В и Г, используется неравномерный (по длине) код: А-00, Б-11, В-010, Г-011. Через канал связи передается сообщение: ГБВАВГ. Закодируйте сообщение данным кодом. Полученную двоичную последовательность переведите в шестнадцатеричную систему счисления. Какой вид будет иметь это сообщение?

1)

71013

2)

DBCAСD

3)

7А13

4)

31А7



Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©uverenniy.ru 2019
обратиться к администрации

    Главная страница