
Представление информации в ЭВМ_4.ppt
- Количество слайдов: 37
Тема 3: Представление и измерение информации в ЭВМ 1
План лекции: 1. 2. 3. 4. 5. 6. 7. Эволюция обработки информации на ЭВМ Формы представления числовых данных в ЭВМ Представление символов Представление графических изображений Цифровое представление звука Представление видеоинформации Измерение информации 2
1. Эволюция обработки информации на ЭВМ Мультимедийные файлы Обработка звука Псевдографика Обработка текстов Только в числовой форме! Автоматизация расчетов Для кодирования информации – двоичный код: {0, 1} 3
2. Формы представления числовых данных в ЭВМ Структурные единицы памяти: Бит = 1 или 0 Байт = 8 бит Машинное слово = 1 байт (8 -разрядная ЭВМ) Машинное слово = 2 байта (16 -разрядная ЭВМ) Машинное слово = 4 байта (32 -разрядная ЭВМ) числа с фиксированной точкой числа с плавающей точкой 4
2. 1. Представление целых чисел Прямой код 510 = 1012 8 -разрядная ЭВМ: 7 6 5 4 3 2 1 0 0 0 1 0 1 16 -разрядная ЭВМ: 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 0 0 1 0 1 Максимальное положительное число 8 -разрядная ЭВМ: 16 -разрядная ЭВМ: 7 6 5 4 3 2 1 0 0 1 1 1 1 011111112 12710 3276710 5
Дополнительный код отрицательного числа Алгоритм: 1) перевод в двоичную СС 2) инвертирование кода 3) прибавить 1 Пример: -710 1) 710 = 000001112 2) 00000111 = 11111000 3) 11111000 + 1 = 11111001 6
Дополнительный код положительного числа прямой код числа Пример: 00000010111 число положительное 4 3 2 1 0 101112 = 1∙ 24 + 0∙ 23 +1∙ 22 + 1∙ 21 +1∙ 20 = = 23 7
Операция сложения положительного числа и отрицательного числа, представленного в прямом коде 1) Прямой код числа 5: 0 000 0101 Прямой код числа -7: 1 000 0111 2) Два исходных числа сравниваются. В разряд знака результата записывается знак большего исходного числа: 1 0000 3) Если числа имеют разные знаки, то вместо операции сложения используется операция вычитания из большего по модулю значения меньшего. При этом первый (знаковый) разряд в операции не участвует. _ 000 0111 000 0101 ------ 000 0010 4) После выполнения операции учитывается первый разряд. Результат операции: 8 1 000 0010, или -2 10
Операция сложения положительного числа и отрицательного числа, представленного в дополнительном коде 1) Прямой код числа 5: 0 000 0101 Прямой код числа -7: 1 000 0111 2) Формирование дополнительного кода числа -7. Прямой код : 1 000 0111 Обратный код: 1 111 1000 Добавление единицы: 1 111 1001 3) Операция сложения. 0 000 0101 + 1 111 1001 ------- 1 1110 4) Проверка результата путем преобразования к прямому коду. Дополнительный код: 1 1110 Вычитание единицы : 1 1101 Инверсия : 1 000 0010 (или -210) 9
2. 2. Представление вещественных чисел Числа с фиксированной точкой 15 14 13 12 11 10 знак числа 9 8 7 6 5 4 3 2 1 0 дробная часть целая часть Числа с плавающей точкой 0. 0000345 0. 345 * 10 -4 Нормализованное представление числа 10900000 0. 109 * 108 мантисса основание порядок 10
Числа с плавающей точкой 0 1 2 3 4 5 6 7 8 9 мантисса (23 разряда) порядок (7 разрядов) знак мантиссы 30 31 0 до 27 Машинный порядок: Мр2=р2+1000 0002 Пример: 1) 250, 1875=1111 1010, 0011 00002 2) 0, 1111 1010 0011 00002 х 1021000 3) Мр2=1000+1000 000= 1001000 4) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 … 31 0 0 0 1 1 1 0 0 0 1 1 0 0 … 0 1 байт 2 байт 3 байт 4 байт 11
Алгоритм для представления действительного числа в памяти ЭВМ: 1. перевести модуль данного числа в двоичную систему счисления; 2. нормализовать двоичное число, т. е. записать в виде M × 2 p, где M — мантисса (ее целая часть равна 1(2)) и p — порядок, записанный в десятичной системе счисления; 3. перевести математический порядок в двоичную систему счисления, затем перевести его в машинный порядок; 4. учитывая знак заданного числа (0 — положительное; 1 — отрицательное), выписать его представление в памяти ЭВМ. Пример Запишем код числа -312, 3125. 1. Двоичная запись модуля 100111000, 0101. 2. Нормализованный вид 100111000, 0101 = 0, 1001110000101 × 29. 3. Машинный порядок 910 = 10012 1001+1000 000= 1001 001. 4. Окончательно 1 1001001 1100 0010 1000 0000 1. C 99 C 28016 = 1 100100111000010100000002 2. Порядок 10010012 = 1000000+ 10012 = 910 3. 0, 1001110000101 × 29. 4. -312, 3125. 12
3. Представление символов ASCII (American Standard Code for International Interchange 8 бит) КОИ-8 (Код Обмена Информацией 8 бит) 13
UNICODE 1 112 064 (= 220 + 216 − 211) Кодовое пространство: • • Плоскость 0 (0000—FFFF): Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP) Плоскость 1 (10000— 1 FFFF): Дополнительная многоязыковая плоскость (Supplementary Multilingual Plane, SMP) Плоскость 2 (20000— 2 FFFF): Дополнительная иероглифическая плоскость (Supplementary Ideographic Plane, SIP) Плоскость 3 (30000— 3 FFFF): Третичная иероглифическая плоскость (Tertiary Ideographic Plane, TIP) Плоскости 4— 13 (40000—DFFFF) не используются Плоскость 14 (E 0000—EFFFF): Дополнительная плоскость особого назначения (Supplementary Special-purpose Plane, SSP) Плоскость 15 (F 0000—FFFFF) используется как дополнительная область-A для частного использования (Supplementary Private Use Area-A, SPUA-A) Плоскость 16 (100000— 10 FFFF) используется как дополнительная область-B для частного использования (Supplementary Private Use Area-B, SPUA-B) 14
Базовая плоскость UNICODE (Basic Multilingual Plane, BMP) Чёрный — расширенный латинский алфавит; Голубой — лингвистические символы международного фонетического алфавита IPA; Синий — другие европейские алфавиты; Оранжевый — письменности Ближнего Востока; Светло-оранжевый — письменности Африки; Зелёный — письменности Южной Азии; Фиолетовый — письменности Юго-восточной Азии; Красный — письменности Восточной Азии; Розовый — унифицированные китайско-японско-корейские символы; Жёлтый — письменности аборигенов Северной Америки; Пурпурный — символы; Тёмно-серый — диакритики; Светло-серый — суррогатные пары UTF-16 и области для частного использования; Циан — другие знаки; Белый — не используется. 15
Пример ASCII-код символа A = 6510 = 4116 = 010001112; ASCII-код символа G = 7110 = 4716 = 010001112; ASCII-код символа Z = 9010 = 5 A 16 = 010110102. ASCII-код символа C = 6710 = 4316 = 011001112 Unicode-код символа C = 6710 = 0000011001112. 16
4. Представление графических изображений растровые векторные пиксел [pixel] растр разрешение [resolution] 640 х480 800 х600 1024 х768 1280 х1024 17
Примеры растровых изображений 18
Пример масштабирования растрового изображения 19
Цветовая модель RGB Red-Green-Blue 1 пиксель = 1 бит 224 цвета Красный (1, 0, 0) Желтый (1, 1, 0) Зеленый (0, 1, 0) Пурпурный (1, 0, 1) Синий (0, 0, 1) Бирюзовый (0, 1, 1) Белый цвет представляется как (1, 1, 1), чёрный – (0, 0, 0) 20
Цветовые модели CMYK или CMY (Cyan-Magenta-Yellow ) Lab субтрактивная Белый (0, 0, 0) HSV (Hue-Saturation-Value) HLS (Hue-Lightness-Saturation) 21
Пример масштабирования векторного изображения 22
5. Цифровое представление звука Для человека диапазон слышимости: от 20 Гц до 17 к. Гц). Амплитуды 8 -битного звука = 28 = 256 уровней амплитуды. Амплитуды 16 -битного звука = 216 = 65536 уровней амплитуды. 23
6. Представление видеоинформации AVI (Audio Video Interleave) MPEG (Motion Picture Expert Group) ISO/IEC (International Standards Organization / International Electrotechnical Commission) Div. X (Digital Video Express) кодеки (от англ. compression/decompression – codec 24
7. Измерение информации Подходы к измерению: • • • структурный, мера информации: ü геометрическая ü комбинаторная ü аддитивная (Хартли) статистический семантический 25
7. 1. Структурный подход (Геометрическая мера) единица хранения – бит 8 бит = 1 байт (сокращенно б или Б), 1024 Б = 1 килобайт (сокращенно Кб или К), 1024 К = 1 мегабайт (сокращенно Мб или М), 1024 М = 1 гигабайт (сокращенно Гб или Г). Пример. Пусть сообщение 55556666888888 закодировано и имеет вид: 5(4)6(4)8(6). Требуется измерить информацию в исходном и закодированном сообщениях геометрической мерой и оценить эффективность кодирования. Решение. I(исх. ) = 14 символов; I(закод. ) = 12 символов. Эффективность: I(исх. ) - I(закод. ) = 2 символа. 26
Комбинаторная мера Пример 1 Автомат, формирующий двузначные десятичные целые положительные числа (исходное множество информационных элементов {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}). Рп(102) = 102 = 100 различных сообщений (двузначных целых положительных чисел Пример 2 Определить емкость ASCII-кода, представленного в двоичной или шестнадцатеричной системе счисления. для двоичного представления – 8 символов для шестнадцатеричного представления – 2 символа I(двоичное) = Рп(28) = 28 = 256; I(шестнадцатеричное) = Рп(162) = 162 = 256, Пример 3. Есть 4 сообщения – a, b, c, d. Выполняется двоичное кодирование этих сообщений кодом постоянной длины. Сколько потребуется для этого двоичных разрядов? 27
Положения комбинаторики, используемые в измерении информации Исходное множество: {a, b, c} h=3 сочетания С: {a, b}, {a, c}, {b, c} перестановки П: {a, b, c}, {b, c, a}, {a, c, b}, {b, a, c}, {c, a, b}, {c, b, a} размещения Р: {a, b}, {b, a}, {a, c}, {c, a}, {b, c}, {c, b} сочетания по 2 элемента с повторениями (Сп): {a, b}, {a, c}, {b, c}, {a, a}, {b, b}, {c, c} перестановки с повторениями (Пп): {a, a, b, c}, {a, a, c, b}, {a, b, a, c}, {a, b, c, a}, {a, c, a, b}, {a, c, b, a}, {b, c, a, a}, {b, a, c, a}, {b, a, a, c}, {c, a, a, b}, {c, a, b, a}, {c, b, a, a} размещения по 2 элемента с повторениями (Рп): {a, b}, {b, a}, {a, c}, {c, a}, {b, c}, {c, b}, {a, a}, {b, b}, {c, c} 28
число сочетаний из h элементов по l с повторениями число сочетаний из h элементов по l без повторений число перестановок из h элементов с повторениями ri, где i – номер символа из исходного множества число перестановок из h элементов без повторений число размещений из h элементов по l c повторениями число размещений из h элементов по l без повторений 29
Пример Исходное множество: {a, b, c} число сочетаний из 3 элементов по 2 без повторений число сочетаний из 3 элементов по 2 с повторениями число перестановок из 3 элементов без повторений число перестановок из 3 элементов с повторениями, причем ra = 2, rb = 1, rc = 1 число размещений из 3 элементов по 2 без повторений число размещений из 3 элементов 30 по 2 с повторениями
Аддитивная мера количество информации длина сообщения мощность исходного алфавита BIT - BInary digi. T Ральф Винтон Лайон Хартли Ralph Vinton Lyon Hartley; 1888 -1970 Пример Рассчитать количество информации, которое содержится в шестнадцатеричном и двоичном представлении ASCII-кода для числа 1. 1 ASCII-код 31 1 двоичный код 00110001 31
Статистический подход вероятность i-го сообщения Клод Э лвуд Ше ннон Claude Elwood Shannon; 1916 -2001 Пример 1 Для хорошего студента – исходы: p(5) = 0. 5; p(4) = 0. 3; p(3) = 0. 1; p(2) = 0. 1 I(5) = -log 2 0, 5 = 1, Пример 2 I(4) = -log 2 0, 3 = 1, 74, Для плохого студента – исходы: I(3) = -log 2 0, 1 = 3, 32, p(5) = 0. 1; p(4) = 0. 2; p(3) = 0. 4; p(2) = 0. 3 I(2) = -log 2 0, 1 = 3, 32. I(5) = -log 2 0, 1 = 3, 32, I(4) = -log 2 0, 2 = 2, 32, I(3) = -log 2 0, 4 = 1, 32 I(2) = -log 2 0, 3 = 1, 74.
Информационная энтропия (Шеннон) (Хартли) 33
Задачи Задача 1. Шарик находится в одной из трех урн: А, В или С. Определить, сколько бит информации содержит сообщение о том, что он находится в урне В. Решение. (бита информации) Задача 2. В учреждении состав работников распределяется так: 3/4 - женщины, 1/4 - мужчины. Вычислить неопределенность, относительно того, кого можно встретить первым, зайдя в учреждение. pi 1/pi Hi=log 2(1/pi) pi*log 2(1/pi) Ж 3/4 4/3 log 2(4/3)=0, 42 3/4 * 0, 42=0, 31 М 1/4 4/1 log 2(4)=2 1/4 * 2=0, 5 Сумма 1 H=0, 81 бит Решение. Задача 3. В учреждении работает одинаковое количество женщин и мужчин. Вычислить неопределенность, относительно того, кого можно встретить первым, зайдя в учреждение. Решение. pi 1/pi Hi=log 2(1/pi) pi*log 2(1/pi) Ж 1/2 2 log 2(2)=1 1/2 * 1=1/2 М 1/2 2 log 2(2)=1 1/2 * 1=1/2 Сумма 1 H=1 бит 34
Обратные задачи Задача. В доме 8 этажей, какое количество информации мы получили, узнав, что некий гражданин Иванов живет на втором этаже? Решение. I=log 2(8)=3 бита. Обратная задача. В результате определения того факта, что некий Иванов живет на втором этаже, было получено 3 бита информации. Определить количество этажей в доме. Решение. N=23=8 этажей. 35
Контрольные вопросы: 1. 2. 3. 4. 5. 6. Рассчитать все возможные комбинации подмножеств для множества, состоящего из 5 элементов. Примечание: считать, что формируем подмножества из 3 элементов, для числа перестановок с повтореньями считать, что r 1=1, r 2=2, r 3=2, r 4=1, r 5=1. Определить количество информации, содержащейся во фразе: «Пусть будет то, что будет. » Определить количество информации, связанное с появлением каждого символа в сообщениях, записанных на языке, алфавит которого состоит из 33 букв и знака «пробел» для разделения слов. Считать, что вероятность появления всех символов – одинаковая. Сообщение о том, что ваш друг живет на 3 этаже, несет 2 бита информации. Сколько этажей в доме? В непрозрачном мешочке хранятся 10 белых, 20 красных, 30 синих и 40 зеленых шариков. Какое количество информации будет содержать зрительное сообщение о цвете вынутого шарика? За контрольную работу по информатике получено 8 пятерок, 13 четверок, 6 троек и 2 двойки. Какое количество информации получил Сидоров при получении тетради с оценкой?
Список литературы: 1. 2. 3. 4. 5. Символы, представленные в Юникоде. Код доступа: http: //ru. wikipedia. org http: //www. slovopedia. com/7/196/861883. html http: //market-pages. ru/infteh http: //ru. wikipedia. org http: //www. anschool-yaya. siteedit. ru/page 86 37