4 Измерение информации - алфавитный подход.ppt
- Количество слайдов: 11
Измерение информации: алфавитный подход
Как измерить информацию? Вопрос: «Как измерить информацию? » очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными. 2
Алфавитный подход к измерению информации При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы. Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые» , «понятные — непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода. 3
Алфавит и его мощность Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т. е. пропуск между словами. Полное количество символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из заглавных русских букв и отмеченных дополнительных символов равна 54. АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЭЮЯ 012345 6789(). , !? «» : -; (пробел) 4
Сколько информации несет один символ Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле: i = log 2 N где N — мощность алфавита. Следовательно, в 2 -символьном алфавите каждый символ «весит» 1 бит (log 22 = 1); в 4 -символьном алфавите каждый символ несет 2 бита информации (log 24 = 2); в 8 -символьном - 3 бита (log 28 = 3) и т. д. 5
Количество информации в тексте Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен: I = К * i, где i — информационный вес одного символа в используемом алфавите. При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита. 6
Задачи 1. Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита? 2. Сообщение, записанное буквами из 64 -символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 7
Задачи 3. Алфавит племени Мульти состоит из 32 символов. Члены племени используют в своей речи и письме только слова длиной 8 символов, причем все слова начинаются или с символа А, или с символа О, остальные буквы в слове могут быть любыми. Какое количество информации несёт одно слово этого племени? 8
Задачи 4. Информационное сообщение объемом 1, 5 Кбайт содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? 5. Сколько килобайт составляет сообщение, содержащее 12288 битов? 9
Задачи 6. Сколько килобайт составит сообщение из 384 символов 16 символьного алфавита? 7. Для записи текста использовался 256 -символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста? 10
Задачи 8. Для записи сообщения использовался 64 -символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байт информации и занимает 6 страниц. Сколько символов в строке? 11