2 кодирование.ppt
- Количество слайдов: 20
Кодирование информации в компьютере Измерение информации
Кодирование информации. Код – это система условных знаков для представления информации Кодирование – это совокупность правил кодового обозначения объекта. Типы кодирования 1. Графический – с помощью специальных рисунков или значков 2. Числовой – с помощью чисел 3. Символьный – с помощью символов того же алфавита, что и исходный текст Язык – это знаковая форма представления информации Алфавит или азбука – полный набор символов, используемый для кодирования текста Естественные языки алфавит грамматика синтаксис Формальные языки может меняться жёстко фиксирован правила с исключениями строгие правила
Двоичное кодирование информации: 1 – есть сигнал 1 и 0 0 – нет сигнала Двоичные цифры - binary digit или сокращённо bit - бит 1 бит информации – это количество информации, уменьшающее неопределённость в два раза 1 бит кодирует 2 понятия или сообщения (0 или 1) 2 бита – 4 разных сообщения (11 или 00 или 01 или 10) 3 бита – 8 разных сообщений 4 бита – 16 разных сообщений и т. д. Элемент памяти компьютера, состоящий из 8 битов, называется байтом 1 0 1 1 0 0 1 1
Количество бит Количество сообщений 1 2 3 4 5 6 7 8 9 2 4 8 16 32 64 128 256 512 m 10 1024 Общая формула: N=2 , где N – количественная информация, m – количество бит
Таблица степени 2 n 1 m 2 n m 2 3 4 2 4 8 16 32 64 128 256 512 1024 11 12 5 13 6 14 2 2048 4096 8192 16384 7 8 9 10 15 16 32768 65536
Кодирование текстовой информации в компьютере Русские прописные буквы (со 128 по 159) Русские строчные буквы (160 -175, 224 -239) Английские прописные буквы Английские строчные буквы Цифры Знаки препинания Скобки и знаки математические операции Специальные символы (@, #, $, %. . ) Знаки псевдографики (со 176 по 223) 33 33 26 26 256 128 Ё – 240, ё - 241 256 = 8 бит = 1 байт 256 возможных сочетаний единиц и нулей Кодирование чисел 37210 = 1011101002 = 5648 = 17316
Фрагмент кодовой таблицы ASCII (American Standard Code for Information Interchange): для кодировки 1 символа используют 1 байт символ Двоичный код Шестнадцатеричный код А 10000000 80 а 10100000 А 0 В 10000010 82 Зафиксированы коды для 128 символов, для латиницы и 128 символов оставлено для национальных алфавитов Решить: Сколько бит информации содержит слово «компьютер» в кодировке ASCII? Для русских букв существуют разные варианта кодовых таблиц (КОИ 8, СР 1251, СР 866, Мас, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Широко используется также новый международный стандарт UNICOD – для кода одного символа отводится 2 байта. Можно закодировать 216=65 536 различных символов
Примеры текстовых форматов Формат ТХТ – базируется на одной из кодовых таблиц, кодирования символов, но не использует таблицы кодирования оформления текста. Формат RTF – содержит много возможностей по оформлению текста. Внимание! Текст, записанный какой-либо программой в одной кодовой таблице, может быть полностью искажён при его чтении с помощью другой программы.
Кодирование графической информации Пиксель (точка) – элементарная мельчайшая единица изображения. Растр – массив элементарных частиц изображения. Степень чёткости зависит от количества точек (разрешение экрана) Достаточно хорошим считается разрешение от 640 х480 точек Кодирование монохромного изображения – 0 и 1 (слишком контрастное) Общепринятое кодирование монохромного изображения 1 пиксель – 1 байт, что позволяет передать 256 оттенков серого цвета Цветное изображение может формироваться различными способами. RGB – красный+зелёный+синий. Для кодирования одного цвета 1 байт всего получается 256 х256=16 777 216 цветов. True Color – полноцветный режим. CMYK – голубой+пурпурный+жёлтый+чёрный Кроме цвета кодируются размер рисунка, яркость и т. д. – всё это образует графический формат BMP (Windows Bitmap), GIF (Compu. Serve GIF), JPEG (JPG Filter) - наиболее известные растровые форматы Векторные форматы: PS и EPS
Кодирование звуковой и видеоинформации Код звука в некоторый момент времени – амплитуда+фаза+частота Непрерывный звуковой сигнал заменяется дискретным Звуковые форматы: • • MP 3 WMA MIDI WAV Кодирование видеоинформации – изображение+изменение изображения+звук+синхронизация звука и изображения • MPEG-1 (фильмы на Video. CD); • MPEG-2 (DVD-диски с фильмами); • MPEG-4 (способ записи и передачи потоковых медиа-данных по каналам с низкой пропускной способностью) • AVI
ИЗМЕРЕНИЕ ИНФОРМАЦИИ
Содержательный подход к измерению информации: много мало Количество информации зависит от информативности сообщения. Количество информации = 0, если с точки зрения конкретного человека в сообщении нет ничего нового Вероятностный подход: сообщение содержит информацию, если оно приводит к уменьшению неопределённости знаний. Равновероятные события Неравновероятные события
Вероятностный подход Равновероятные события Формула Хартли Формула: N=2 I где N – количество возможных вариантов, I– количество информации I = log 2 N, где I – количество информации Общая формула: N=2 m, где N – количественная информация, m – количество бит Задания: 1. В корзине лежат 8 шаров разного цвета. Сколько информации несёт сообщение о том, что достали красный шар? 2. Была получена телеграмма: «Встречайте, вагон 7» . Известно, что в поезде 16 вагонов. Какое количество информации было получено?
Вероятностный подход Неравновероятные события I = log 2 N N=2 I Формула Шеннона I = log 2 (1/p) Р = К/N где I – количество информации р – вероятность события К – величина, показывающая, сколько раз произошло событие N – общее число возможных исходов какого-то процесса Задания: 1. В корзине лежат 8 чёрных шаров и 24 белых. Сколько информации несёт сообщение о том, что достали чёрный шар? (2 бита) 2. Известно, что в ящике лежат белые и чёрные шары, из которых 18 – черных. Сообщение о том, что достали белый шар, несёт 2 бита информации. Сколько всего в корзине шаров? (24 шара)
Решить 1. В мешке находятся 20 шаров. Из них 15 белых и 5 красных. Какое количество информации несет сообщение о том, что достали красный шар. Решение: Рк = 5 / 20 = 0, 25. Iк = log 2 (1/ Рк) = log 2( 1/0, 25) = log 24 = 2 бит. Ответ: Iк =2 бит. 2. Сколько информации содержит сообщение, уменьшающее неопределенность знаний в 8 раз? Ответ: 3 бита. 3. Предложение состоит из двух слов из 5 и 7 букв соответственно и четырёхзначного числа. Сколько бит информации содержит такое предложение в кодировке ASCII? Ответ: 144 бита. 4. В коробке лежат 64 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бита информации. Сколько белых карандашей было в коробке? Ответ: 4 белых карандаша.
Алфавитный подход I = log 2 N Iт = K· I N = 2 I K = Iт /I I = Iт /K N – мощность алфавита I – информационный объём одного символа К – количество символов в сообщении Iт - информационный объём всего сообщения При алфавитном подходе к измерению информации её количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. Пример: с точки зрения алфавитного подхода в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается!
Пример Найти объём информации, содержащейся в тексте из 3000 символов, написанном русскими буквами. 1. Найдём мощность алфавита: N = 33 прописных буквы + 33 строчных буквы + 21 специальный знак = 87 символов 2. Подставим в формулу и рассчитаем количество информации I = log 287 = 6, 4 бита ( информационный объём одного символа 3. Находим информационный объём всего текста 6, 4 * 3000 = 19140 бит Задания: 1. Сообщение, записанное буквами из 64 -символьного алфавита, содержит 20 (120 бит) символов. Какой объём информации оно несёт? 2. Сообщение, содержащее 80 символов, написано символами 32 -символьного алфавита, а сообщение, написанное символами 64 -символьного алфавита, содержит 70 символов. Объём информации какого письма больше? (400 и 420 бит)
Единицы измерения информации 1 байт = 8 бит 1 килобайт (1 Кб) = 210 байт =1024 байта 1 мегабайт (1 Мб) = 210 Кб = 1024 Кб 1 гигабайт (1 Гб) = 210 Мб = 1024 Мб Задание: 1. Сколько килобайтов составляет сообщение, содержащее 12288 битов? (1, 5 Кбайта) 2. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой странице записано 256 символов. Какова мощность использованного алфавита? (2 символа)
Выводы 1. Кодирование – это операция преобразования символов или группы символов одного кода в символы или группы символов другого кода 2. Вычислительная техника работает с информацией, которая кодируется последовательностью двух знаков – 0 и 1 3. Измерение информации. Общая формула измерения информации: N=2 m, где N – количественная информация, m – количество бит Содержательный подход: много или мало Вероятностный подход: равновероятные события I = log 2(l/p), где I — это количество информации, р - вероятность события. Алфавитный подход: I = log 2 N Iт = K· I I = log 2 N, где I – количество информации неравновероятные события