Скачать презентацию Кодирование информации Измерение информации Кодирование информации Код Скачать презентацию Кодирование информации Измерение информации Кодирование информации Код

2 кодирование.ppt

  • Количество слайдов: 21

Кодирование информации Измерение информации Кодирование информации Измерение информации

Кодирование информации. Код – это система условных знаков для представления информации Кодирование – это Кодирование информации. Код – это система условных знаков для представления информации Кодирование – это совокупность правил кодового обозначения объекта. Типы кодирования 1. Графический – с помощью специальных рисунков или значков 2. Числовой – с помощью чисел 3. Символьный – с помощью символов того же алфавита, что и исходный текст Язык – это знаковая форма представления информации Алфавит или азбука – полный набор символов, используемый для кодирования текста Естественные языки алфавит грамматика синтаксис Формальные языки может меняться жёстко фиксирован правила с исключениями строгие правила

Двоичное кодирование информации: 1 – есть сигнал 1 и 0 0 – нет сигнала Двоичное кодирование информации: 1 – есть сигнал 1 и 0 0 – нет сигнала Двоичные цифры - binary digit или сокращённо bit - бит 1 бит информации – это количество информации, уменьшающее неопределённость в два раза 1 бит кодирует 2 понятия или сообщения (0 или 1) 2 бита – 4 разных сообщения (11 или 00 или 01 или 10) 3 бита – 8 разных сообщений 4 бита – 16 разных сообщений и т. д. Элемент памяти компьютера, состоящий из 8 битов, называется байтом 1 0 1 1 0 0 1 1

Количество бит Количество сообщений 1 2 3 4 5 6 7 8 9 2 Количество бит Количество сообщений 1 2 3 4 5 6 7 8 9 2 4 8 16 32 64 128 256 512 m 10 1024 Общая формула: N=2 , где N – количественная информация, m – количество бит

Таблица степени 2 n 1 m 2 n m 2 3 4 2 4 Таблица степени 2 n 1 m 2 n m 2 3 4 2 4 8 16 32 64 128 256 512 1024 11 12 5 13 6 14 2 2048 4096 8192 16384 7 8 9 10 15 16 32768 65536

Кодирование чисел 37210 = 1011101002 = 5648 = 17316 Кодирование текстовой информации в компьютере Кодирование чисел 37210 = 1011101002 = 5648 = 17316 Кодирование текстовой информации в компьютере Русские прописные буквы (со 128 по 159) Русские строчные буквы (160 -175, 224 -239) Английские прописные буквы Английские строчные буквы Цифры Знаки препинания Ё – 240, ё 241 Скобки и знаки математические операции Специальные символы (@, #, $, %. . ) Знаки псевдографики (со 176 по 223) 256 = 33 33 26 26 256 128 8 бит = 1 байт 256 возможных сочетаний единиц и нулей

Фрагмент кодовой таблицы ASCII (American Standard Code for Information Interchange): для кодировки 1 символа Фрагмент кодовой таблицы ASCII (American Standard Code for Information Interchange): для кодировки 1 символа используют 1 байт символ Двоичный код Шестнадцатеричный код А 10000000 80 а 10100000 А 0 В 10000010 82 Зафиксированы коды для 128 символов, для латиницы и 128 символов оставлено для национальных алфавитов Решить: Сколько бит информации содержит слово «компьютер» в кодировке ASCII? Для русских букв существуют разные варианта кодовых таблиц (КОИ 8, СР 1251, СР 866, Мас, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Широко используется также новый международный стандарт UNICOD – для кода одного символа отводится 2 байта. Можно закодировать 216=65 536 различных символов

Примеры текстовых форматов Формат ТХТ – базируется на одной из кодовых таблиц, кодирования символов, Примеры текстовых форматов Формат ТХТ – базируется на одной из кодовых таблиц, кодирования символов, но не использует таблицы кодирования оформления текста. Формат RTF – содержит много возможностей по оформлению текста. Внимание! Текст, записанный какой-либо программой в одной кодовой таблице, может быть полностью искажён при его чтении с помощью другой программы.

Кодирование графической информации Пиксель (точка) – элементарная мельчайшая единица изображения. Растр – массив элементарных Кодирование графической информации Пиксель (точка) – элементарная мельчайшая единица изображения. Растр – массив элементарных частиц изображения. Степень чёткости зависит от количества точек (разрешение экрана) Достаточно хорошим считается разрешение от 640 х480 точек Кодирование монохромного изображения – 0 и 1 (слишком контрастное) Общепринятое кодирование монохромного изображения 1 пиксель – 1 байт, что позволяет передать 256 оттенков серого цвета Цветное изображение может формироваться различными способами. RGB – красный+зелёный+синий. Для кодирования одного цвета 1 байт всего получается 256 х256=16 777 216 цветов. True Color – полноцветный режим. CMYK – голубой+пурпурный+жёлтый+чёрный Кроме цвета кодируются размер рисунка, яркость и т. д. – всё это образует графический формат BMP (Windows Bitmap), GIF (Compu. Serve GIF), JPEG (JPG Filter) - наиболее известные растровые форматы Векторные форматы: PS и EPS

Кодирование звуковой и видеоинформации Код звука в некоторый момент времени – амплитуда+фаза+частота Непрерывный звуковой Кодирование звуковой и видеоинформации Код звука в некоторый момент времени – амплитуда+фаза+частота Непрерывный звуковой сигнал заменяется дискретным Звуковые форматы: • • MP 3 WMA MIDI WAV Кодирование видеоинформации – изображение+изменение изображения+звук+синхронизация звука и изображения • MPEG-1 (фильмы на Video. CD); • MPEG-2 (DVD-диски с фильмами); • MPEG-4 (способ записи и передачи потоковых медиа-данных по каналам с низкой пропускной способностью) • AVI

ИЗМЕРЕНИЕ ИНФОРМАЦИИ ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Содержательный подход к измерению информации: много мало Количество информации зависит от информативности сообщения. Количество Содержательный подход к измерению информации: много мало Количество информации зависит от информативности сообщения. Количество информации = 0, если с точки зрения конкретного человека в сообщении нет ничего нового Вероятностный подход: сообщение содержит информацию, если оно приводит к уменьшению неопределённости знаний. Равновероятные события Неравновероятные события

Вероятностный подход Равновероятные события Формула Хартли Формула: N=2 I где N – количество возможных Вероятностный подход Равновероятные события Формула Хартли Формула: N=2 I где N – количество возможных вариантов, I– количество информации I = log 2 N, где I – количество информации Общая формула: N=2 m, где N – количественная информация, m – количество бит Задания: 1. В корзине лежат 8 шаров разного цвета. Сколько информации несёт сообщение о том, что достали красный шар? 2. Была получена телеграмма: «Встречайте, вагон 7» . Известно, что в поезде 16 вагонов. Какое количество информации было получено?

Вероятностный подход Неравновероятные события I = log 2 N N=2 I Формула Шеннона I Вероятностный подход Неравновероятные события I = log 2 N N=2 I Формула Шеннона I = log 2 (1/p) Р = К/N где I – количество информации р – вероятность события К – величина, показывающая, сколько раз произошло событие N – общее число возможных исходов какого-то процесса Задания: 1. В корзине лежат 8 чёрных шаров и 24 белых. Сколько информации несёт сообщение о том, что достали чёрный шар? (2 бита) 2. Известно, что в ящике лежат белые и чёрные шары, из которых 18 – черных. Сообщение о том, что достали белый шар, несёт 2 бита информации. Сколько всего в корзине шаров? (24 шара)

Решить 1. В мешке находятся 20 шаров. Из них 15 белых и 5 красных. Решить 1. В мешке находятся 20 шаров. Из них 15 белых и 5 красных. Какое количество информации несет сообщение о том, что достали красный шар. Решение: Рк = 5 / 20 = 0, 25. Iк = log 2 (1/ Рк) = log 2( 1/0, 25) = log 24 = 2 бит. Ответ: Iк =2 бит. 2. Сколько информации содержит сообщение, уменьшающее неопределенность знаний в 8 раз? Ответ: 3 бита. 3. Предложение состоит из двух слов из 5 и 7 букв соответственно и четырёхзначного числа. Сколько бит информации содержит такое предложение в кодировке ASCII? Ответ: 152 бит. 4. В коробке лежат 64 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бита информации. Сколько белых карандашей было в коробке? Ответ: 4 белых карандаша.

Алфавитный подход I = log 2 N Iт = K· I N = 2 Алфавитный подход I = log 2 N Iт = K· I N = 2 I K = Iт /I I = Iт /K N – мощность алфавита I – информационный объём одного символа К – количество символов в сообщении Iт - информационный объём всего сообщения При алфавитном подходе к измерению информации её количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. Пример: с точки зрения алфавитного подхода в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается!

Пример Найти объём информации, содержащейся в тексте из 3000 символов, написанном русскими буквами. 1. Пример Найти объём информации, содержащейся в тексте из 3000 символов, написанном русскими буквами. 1. Найдём мощность алфавита: N = 33 прописных буквы + 33 строчных буквы + 21 специальный знак = 87 символов 2. Подставим в формулу и рассчитаем количество информации I = log 287 = 6, 4 бита ( информационный объём одного символа 3. Находим информационный объём всего текста 6, 4 * 3000 = 19140 бит Задания: 1. Сообщение, записанное буквами из 64 символьного алфавита, содержит 20 (120 бит) символов. Какой объём информации оно несёт? 2. Сообщение, содержащее 80 символов, написано символами 32 символьного алфавита, а сообщение, написанное символами 64 символьного алфавита, содержит 70 символов. Объём информации какого письма больше? (400 и 420 бит)

Единицы измерения информации 1 байт = 8 бит 1 килобайт (1 Кб) = 210 Единицы измерения информации 1 байт = 8 бит 1 килобайт (1 Кб) = 210 байт =1024 байта 1 мегабайт (1 Мб) = 210 Кб = 1024 Кб 1 гигабайт (1 Гб) = 210 Мб = 1024 Мб Задание: 1. Сколько килобайтов составляет сообщение, содержащее 12288 битов? (1, 5 Кбайта) 2. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой странице записано 256 символов. Какова мощность использованного алфавита? (2 символа)

Решить: 1. В корзине лежат красные и желтые шары. Всего шаров 16. Сообщение о Решить: 1. В корзине лежат красные и желтые шары. Всего шаров 16. Сообщение о том, что достали желтый шар, несет 3 бита информации. Сколько красных шаров в корзине? 14 шаров 2. В корзине лежат красные и черные клубки шерсти. Красных клубков 6. Сообщение о том, что достали черный клубок, несет 2 бита информации. Сколько всего клубков в корзине? 8 клубков 3. В корзине лежат 8 красных и синих кубиков. Синих кубиков на 4 меньше, чем красных. Какое количество информации несёт сообщение о том, что достали синий кубик? 2 бита 4. Растровый графический файл содержит черно белое изображение с 2 градациями цвета (черный и белый) размером точек. Определите необходимый для кодирования цвета точек (без учета служебной информации о формате, авторстве, способах сжатия и пр. ) размер этого файла на диске в байтах. 60000 байт

5. Объем текстовой информации в сообщении на 40 страницах (на странице 40 строк по 5. Объем текстовой информации в сообщении на 40 страницах (на странице 40 строк по 80 символов в каждой) в кодировке ASCII равен… 125 Кбайт 6. Найдите х: 4 х бит = 2 Кбайта. 7. При составлении сообщения использовали 64 символьный алфавит. Каким будет информационный объем такого сообщения в байтах, если оно содержит 3072 символа? 2304 байта 8. Сообщение занимает 4 страницы по 40 строк и содержит 7200 байтов информации. Сколько символов в строке, если при составлении это го сообщения использовали 64 символьный алфавит? 60 символов в строке