Цифровые данные СОДЕРЖАНИЕ 3 Цифровые данные 3

Скачать презентацию Цифровые данные СОДЕРЖАНИЕ 3 Цифровые данные 3

03_Цифровые данные.ppt

Количество слайдов: 21

Цифровые данные

СОДЕРЖАНИЕ 3. Цифровые данные 3. 1. Дискретизация аналоговых сигналов 3. 2. Аналого-цифровое преобразование звука 3. 3. Кодирование цифровых изображений 3. 4. Кодирование цифровых видеоданных 3. 5. Кодирование текста 3. 6. Количество и объем информации 3_Цифровые данные.

ЦИФРОВЫЕ ДАННЫЕ Цифровые данные – это массив цифр, который описывает свойства аналоговых объектов реального мира 3_Цифровые данные. Описание голоса (звука) набором цифр Описание изображения набором цифр Описание видео набором цифр Описание текста набором цифр … 10010100001001010… … 1111111000001011 … … 001101010010… … 1010101000110… Цифровые данные в памяти компьютера Аналоговые данные реального мира Поскольку компьютерные технологии работают с данными, представленными в цифровой форме, аналоговые (непрерывные) данные надо преобразовывать в цифровые.

ДИСКРЕТИЗАЦИЯ АНАЛОГОВЫХ ДАННЫХ Основной процедурой аналого-цифрового преобразования (АЦП) является разделение (дискретизация) пространства и времени на фиксированные по размеру области (точки, отрезки, прямоугольники и т. п. ). В каждой такой области характеристики аналогового сигнала считаются одинаковыми. АЦП всегда приводит к потере части аналоговой информации. Аналоговые данные Y 4 Y 3 Дискретные данные Y 2 Y 1 X 2 X 3 X 4 Предполагаем, что в пределах ступеньки положение человека в пространстве не меняется Принцип дискретизации Положение человека на наклонной линии задают значения координат X и Y. Они изменяются непрерывно и принимают бесконечное множество значений. На лестнице координаты человека принимают дискретные значения Xi и Yj и изменяются скачкообразно. Чем выше и шире ступеньки лестницы, тем «грубее» дискретизация аналоговых данных X и Y. 3_Цифровые данные.

ПРИМЕРЫ АНАЛОГОВОГО И ЦИФРОВОГО ЗВУКОВ Струны музыкального инструмента и голосовые связки человека создают (но не сохраняют) аналоговый звук. Виниловая пластинка сохраняет (но не издает) аналоговый звук, т. к. звуковая дорожка изменяет свою форму непрерывно. (3) (1) Компакт-диск сохраняет цифровые двоичные данные, т. к. они записаны при помощи микрорельефа – чередования участков двух типов, с разной способностью отражать лазерный луч. Конструктивно компакт-диск – это (1) прозрачная подложка, (2) информационный рисунок из ямок (питов) и промежутков между ямками (лэндов) и (3) отражающий слой. Питы и лэнды обеспечивают разную интенсивность отражения луча от отражающего слоя при его поступлении через подложку на вращающийся диск. Виниловая пластинка и компакт диск под микроскопом. 3_Цифровые данные.

ТЕОРЕМА КОТЕЛЬНИКОВА Теорема Котельникова (1933 год): если аналоговый сигнал имеет ограниченный спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой строго большей удвоенной максимальной частоты спектра. С именем В. А. Котельникова (1908 – 2004) связано важнейшее научное направление – цифровая обработка сигналов. Теория потенциальной помехоустойчивости, созданная ученым, определяет качество любых каналов связи – от традиционных радиорелейных линий и станций до самых современных волоконно-оптических и спутниковых линий связи, сотовых радиотелефонов и скрытной связи на шумоподобных сигналах. Прочно связано с именем В. А. Котельникова новое направление в освоении космоса – планетная радиолокация. Благодаря ей удалось существенно уточнить астрономическую единицу и размеры нашей Солнечной системы, тем самым обеспечив возможности точного вывода космических аппаратов на орбиты планет и их мягкой посадки, получения радиолокационных изображений ландшафтов планет, даже таких закрытых облаками, как Венера. Деятельность В. А. Котельникова составляет эпоху в отечественной и мировой радиотехнике и информатике. 3_Цифровые данные.

АНАЛОГО-ЦИФРОВОЕ ПРЕОБРАЗОВАНИЕ ЗВУКА Одна гармоника звукового сигнала Уровни квантования Аналоговый звук представляет собой сумму гармоник (синусоидальных колебаний). Примером источника аналогового звука являются голосовые связки человека или струна музыкального инструмента. Дискретизация (квантование по уровню) замещает аналоговый сигнал дискретными отсчетами (отрезками). Период временной дискретизации определяется теоремой В. А. Котельникова. Длина отрезков равна уровню сигнала в соответствующий момент времени. Кодирование При кодировании каждому дискретному отсчету сопоставляется двоичный код, задающий длину отрезка (уровень аналогового сигнала в этот момент времени). Полученный цифровой сигнал может быть сохранен в памяти компьютера или передан в линию связи. Аналоговый и дискретный сигналы 3_Цифровые данные. Цифро-аналоговое преобразование

ПРИМЕРЫ АНАЛОГОВЫХ И ЦИФРОВЫХ ИЗОБРАЖЕНИЙ Изображение – это зрительное восприятие чего-либо. В аналоговых изображениях цвет и контуры фигур меняются непрерывно. Их можно создать при помощи пленочного фотоаппарата на молекулярном уровне. Цифровое изображение – это набор квадратов разного цвета, на границе которых цвет и контуры фигур меняются скачкообразно. Качество изображения зависит от размера квадратов. Их можно создать при помощи цифрового фотоаппарата, матрица светочувствительных элементов которого преобразует свет (поток фотонов) в электрический сигнал (в электроны) за счет внутреннего фотоэффекта в кремниевой структуре. Чем больше света попадает на элемент, тем образуется больше электронов и выше напряжение сигнала на выходе элемента. Этому напряжению сопоставляется цифровой код, который сохраняет ся в памяти фотоаппарата. Элементы закрыты красными, зелеными и синими светофильтрами и поэтому несут информацию о цвете. Из-за особенностей восприятия цвета глазом человека зеленых фильтров больше, чем красных и синих. 3_Цифровые данные.

ЦИФРОВЫЕ ИЗОБРАЖЕНИЯ Мозаика из кусков колотой смальты Отдельные элементы цифровых изображений на- Табло 8*8 и 16*16 пикселей зываются пикселями. Для перехода от аналогового изображения к цифровому необходимо осу -ществить пространственную дискретизацию – разбить изображение на отдельные пиксели. Сохранить изображение – значит сохранить данные о расположении (координатах в пределах изображения) и о цвете каждого пикселя. Данные о координатах пикселей задают двумя способами: 1) растровой картой – это массив данных, элементы которого определяют положение и цвет пикселей на плоском изображении (растровая графика); Изображения и соответствующие им растровые карты (2 и 4 цвета) 2) геометрическими примитивами – прямоугольниками, окружностями, эллипсами, линиями и др. – которые задаются формулами относительно точки начала координат (векторная графика). Например, окружность и треугольник можно задать так: . (x-x 0)2+(y-y 0)2=R 2 (x 1, y 1); (x 2, y 2); (x 3, y 3) Большинство устройств вывода являются растровыми устройствами и перед выводом изображения векторная форма преобразуется в растровую. 3_Цифровые данные.

ЗАДАНИЕ ЦВЕТА ПИКСЕЛЕЙ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ Цвет пикселя можно задать двумя способами: 1) номером цвета в палитре – специальной структуре данных; 2) номерами яркости координат модели RGB (Red, Green, Blue). Глубина цвета – это количество бит, которое выделяется для задания цвета одного пикселя. Палитра используется, если нужно задать небольшое количество (обычно от 2 до 256) цветов. Если же изображение характеризуется разнообразной цветовой гаммой, то модель RGB позволяет уменьшить «вес» (объем) изображения. Глубина Количество цвета, бит цветов 1 2 8=3+3+2 28=256 12=4+4+4 212=4 096 16=5+6+5 216=65 536 18=6+6+6 218=262 144 24=8+8+8 ~16, 5 млн. Качество изображения и объем данных для его сохранения зависят от (1) разрешения (количества пикселей на единицу площади изображения) и от (2) глубины цвета. 3_Цифровые данные. <объем изображения> = =<разрешение >*<площадь изображения>*<глубина цвета>

ПРИМЕР ОЦИФРОВКИ ИЗОБРАЖЕНИЯ Оценка объема изображения: Всего пикселей ~ 16*109 Глубина цвета 32 бит = 4 байта Объем изображения ~ 64*109 байт = 64 Гбайт В интернете открыт доступ к репродукции фрески Леонардо да Винчи «Тайная вечеря» в высоком разрешении – более 16 гигапикселей (16*109 пикселей), 172 181 пикселей в ширину и 93 611 пикселей в высоту. Качество изображения не теряется даже при многократном увеличении и позволяет рассмотреть каждый миллиметр росписи. Это сделано для всех желающих изучить выдающиеся произведение искусства, доступ к оригиналу которого ограничен из-за трудностей его сохранения. Благодаря оцифровке можно увидеть даже черновой рисунок Леонардо, сделанный им еще до нанесения красочного слоя на стену. 3_Цифровые данные.

ЦИФРОВЫЕ ВИДЕОДАННЫЕ Видео – это изображение, которое изменяется во времени. Статические изображения, являющиеся элементами видеоряда, называются кадры. Принцип последовательной демонстрации кадров (сначала 16, потом 24 кадра в секунду) был изобретен в аналоговых кино и ТВ. Первый кинофильм создали братья Люмьер – «Прибытие поезда на вокзал Ла-Сиоты » , 1895 г. В кино кадры формируются на кинопленке на молекулярном уровне. В аналоговом ТВ кадры формируются кадровой и строчной развертками при помощи электроннолучевой трубки. Цифровое видео – это видео, в котором отдельные кадры (фреймы) формируются как цифровые изображения. Количество фреймов в секунду (fps) изменяется от 25 и больше. Главная проблема при хранении и обработки цифровых видеоданных – их большой объем, который можно подсчитать так: <объем видеоданных> = <объем фрейма>**<время в сек. > 3_Цифровые данные.

СЖАТИЕ ЦИФРОВЫХ ВИДЕОДАННЫХ Для уменьшения объема видеоданных применяют кодирование с потерей исходной информации. В основе сжатия лежит два принципа: 1) пространственный – каждый кадр содержит группы близких по цвету пикселей. Их различия почти незаметны для глаза человека. Если заменить близкие цвета одним цветом, то можно сократить код за счет образования одинаковых областей кадра; 2) временной – несколько соседних кадров как правило мало отличаются друг от друга. Поэтому можно выделить ключевые кадры, а в остальных кадрах хранить информацию только об имеющихся отличиях от ключевых кадров. 24 – 200 fps 3_Цифровые данные. Кл юч е вы е ка др ы е вы ия о фр жен Ци ра ы) об р из (кад

СТАНДАРТНЫЕ РАЗРЕШЕНИЯ ВИДЕО И СООТНОШЕНИЕ СТОРОН ЭКРАНА 3_Цифровые данные.

ДВОИЧНОЕ КОДИРОВАНИЕ ТЕКСТА Присвоение символу определенного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange). В ней на 1 символ отводится 1 байт и можно закодировать 28 = 256 символов: коды с 0 по 32 – функциональные клавиши (перевод строки, пробел и т. п. ); коды с 33 по 127 – символы латинского алфавита, цифры, арифметические операции, знаки препинания; коды с 128 по 255 – символы для кодировки национального алфавита. Используется пять кодировок кириллицы: КОИ-8, CP 866, СР 1251, ISO, Mac. Для перехода из одной кодировки в другую разработаны специальные программы – конверторы. В 1997 году (на замену АSCII) принят международный стандарт Unicode, который отводит для кодировки одного сим -вола 2 байта, и позволяет закодировать 216 = 65536 символов. Он включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, множество математических, музыкальных, химических и прочих символов. 3_Цифровые данные.

КИРИЛЛИЦА В ТАБЛИЦЕ ASCII (КOI-8 R, UNIX) 1111 1110 1101 1100 1011 10001111 - код 143 -го символа 1010 1001 1000 0111 0100 0011 0010 0001 0000 10000000 - код 128 -го символа 0110 Символы псевдографики 1000 1001 1010 1011 1100 1101 1110 1111 3_Цифровые данные. 1111000 0 Слово «Бит» в кодировке KOI-8 R: 11100010 11001001 11010100 1111111 1

КИРИЛЛИЦА В ТАБЛИЦЕ ASCII (СР 866, MS DOS) 1111 1110 1101 1100 1011 1010 1001 1000 0111 0110 10001111 - код 143 -го символа 0101 0100 0011 0010 0001 0000 10000000 - код 128 -го символа 1000 1001 1010 1011 1100 1101 1110 1111 240 3_Цифровые данные. Коду 11100010 11001001 11010100 соответствуют: в кодировке СР 866 символы – «т╔╘» , в кодировке KOI-8 R символы – «Бит» 255

КИРИЛЛИЦА В ТАБЛИЦЕ ASCII (CP 1251, Windows) 1111 1110 1101 1100 1011 1010 1001 1000 0111 10001111 - код 143 -го символа 0110 0101 0100 0011 0010 0001 0000 10000 - код 128 -го символа 1000 1001 1010 1011 1100 1101 1110 1111 240 3_Цифровые данные. В кодировке СР 1251 представлена кириллица русского, украинского, белорусского, сербского, болгарского, македонского и других алфавитов. Код 11100010 11001001 11010100 KOI-8 R СР 866 CP 1251 «Бит» «т╔╘» «в. Йф» 255

КОЛИЧЕСТВО ИНФОРМАЦИИ Теория информации рассматривает понятие «количество информации» , не связывая его со смыслом, с содержательной стороной. Предполагается, что чем больше двоичных символов необходимо использовать для кодирования информации, тем больше ее количество. В основе такой оценки лежит следующая идея: «информация устраняет неопределенность, незнание того, в каком из возможных состояний находится описываемый объект» (К. Шеннон). Следующие определения понятия «информация» дали ученые – авторы теории, положенной в основу современных инфотехнологий. В этих определениях нет даже упоминания о смысле: Информация – отрицательная энтропия (негэнтропия) (Л. Бриллюэн). Информация – снятая неразличимость, передача разнообразия (У. Р. Эшби). Информация – мера сложности структур, мера упорядоченности материальных систем (А. Моль). Информация – отраженное разнообразие (А. Д. Урсул). Информация – вероятность выбора (А. М. Яглом, И. М. Яглом). Информация – это обозначение содержания, полученного от внешнего мира в процессе приспособления к нему (Н. Винер). Чем больше неопределенность выбора (чем в большем числе состояний может находиться объект), тем больше информации можно получить из сообщения о его конкретном текущем состоянии, так как это сообщение устраняет большую неопределенность. 3_Цифровые данные. Какая из двух картинок на этом слайде содержит больше информации?

ЧТО ТАКОЕ ИНФОРМАЦИЯ ДЛЯ ИНЖЕНЕРА? Не верьте пехоте, когда она бравые песни поет! Не верьте инженерам, когда они говорят про информацию! Информация для инженера – это внутреннее свойство сообщения. Информация никак на связывается инженером со смыслами, вложенными в сообщение авторами. Объектом исследования и преобразования для инженера являются данные. 3_Цифровые данные.

ИЗМЕРЕНИЕ ОБЪЕМА ИНФОРМАЦИИ Килобайт (Кбайт) 210 =1024 ≈ 103 байт, 2 Кбайт: машинописная страница, 100 Кбайт: фотография с низким разрешением, Мегабайт (Мбайт) 220 ≈ 1000000 байт, 1 Мбайт: небольшой роман, 2 Мбайт: фотография с высоким разрешением, 5 Мбайт: собрание работ Шекспира, 10 Мбайт: минута аудиозаписи высокого качества, 100 Мбайт: полка книг длиной 1 метр, 700 Мбайт: один CD, Гигабайт (Гбайт) 230 ≈ 100000 байт, 1 Гбайт: грузовик книг, 20 Гбайт: запись всех сочинений Бетховена, 100 Гбайт: библиотечное собрание академических журналов, Терабайт (Тбайт) 240 ≈ 1000000 байт, 1 Тбайт: текст, который может быть напечатан на бумаге из 50 тыс. деревьев, 2 Тбайт: крупная академическая библиотека, 10 Тбайт: печатные материалы библиотеки Конгресса США, 100 - 400 Тбайт: объем памяти человека, Петабайт (Пбайт) 250 ≈ 100000000 байт, 2 Пбайт: все академические библиотеки США, 20 Пбайт: емкость жестких дисков, выпущенных в 1995 году, 200 Пбайт: все когда-либо напечатанное, Экзабайт (Эбайт) 260 ≈ 1000000000, 2 Эбайт: общее количество данных, произведенных в 1999 году (площадь CD, требуемых для хранения, более 2 млн. м 2, вес – более 15 тыс. т), 5 Эбайт: количество слов, высказанное человечеством за все время его существования. 80 экзабайт: объем данных в 2014 г. (80% – неструктурированные файловые данные). Зеттабайт (Збайт) 270 ≈ 100000000000 байт Сколько будет весить информация, которую Земляне должны взять с собой на Марс? 3_Цифровые данные. Где больше смысла: в работах Шекспира или в данных 1999 года?