Лекция 1. Архивация и сжатие данных.ppt
- Количество слайдов: 31
АРХІВАЦІЯ ТА СТИСНЕННЯ АУДІО ТА ВІДЕО ЗОБРАЖЕНЬ Лекція 1 Вступна. Загальні поняття
СТРУКТУРА КУРСА Архівація і стиснення аудіо і відеозображень Лекції – 17 год Лабораторні заняття – 16 год Розрахункова-графічна робота -10 год Іспит
ЛІТЕРАТУРА 1. 2. 3. 4. Ватолин Д. , Ратушняк А. , Смирнов М. , Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. – М. : ДИАЛОГ-МИФИ, 2003 – 384 с. Д. Сэломон. Сжатие данных, изображения и звука. – М. : Техносфера, 2004 – 368 с. Трофимова И. П. Системы обработки и хранения информации. – М. : Высшая школа, 1989 – 191 с. Фомін А. А. Основы сжатия информации / Фомин А. А. – С. -Петербург: С-ПГТУ, 1998. – 84 с.
ЗМІСТ ЛЕКЦІЇ Тема 1. Теоретичні основи дисциплини Місце дисципліни в системі підготовки фахівця з технології електронних мультимедійних видань 2. Актуальність проблеми 1. Історія питання Термінологія Визначення інформації 4. Використання архівації 5. Моделювання джерела інформації 6. Контрольні питання 3.
МІСЦЕ ДИСЦИПЛІНИ В СИСТЕМІ ПІДГОТОВКИ ФАХІВЦЯ З ТЕХНОЛОГІЇ ЕЛЕКТРОННИХ МУЛЬТИМЕДІЙНИХ ВИДАНЬ Знати Основні положення архівації і стиснення аудіо і відеоданих Методи та алгоритми архівації і стиснення аудіо і відеоданих Інтегровані середовища програм архівації і стиснення аудіо і відеоданих Вміти Розробляти алгоритми розв'язання задач Використовувати методи та алгоритми Розробляти та тестувати програми
АКТУАЛЬНІСТЬ ПРОБЛЕМИ Протиріччя Кількість інформації Об'єми носіїв інформації та перепускна здатність каналу передачі даних ПРОБЛЕМА : Передача даних по існуючим каналам зв'язку
ШЛЯХИ ВИРІШЕННЯ ПРОБЛЕМИ Тривіальний – обмеження обсягів інформації Витратний – фінансування створення нових носіїв та каналів зв'язку Реальний – стиснення інформації
3. ІСТОРІЯ ПИТАННЯ 1829 рік – Абетка Л. Брайля для незрячих Деякі прийоми скорочення та короткі слова Інтуітивний стиск інформації
3. 1 ІСТОРІЯ ПИТАННЯ 1928 р. - формула Хартлі про кількість інформації 40 р. – праці Клода Шеннона про кількість інформації та оптимальне її збереження Алгоритми стиску даних Шеннона-Фано та Хаффмена – використання більш коротких кодів для часто зутрічаючихся и більш довгі для рідко зустрічаючихся об'єктів
3. 3 ІСТОРІЯ ПИТАННЯ 1977 -78 роки – розробка алгоритмів Лемпела-Зіва LZ 77 и LZ 78 1980 – Террі Велч вдосконалює алгоритм Лемпела-Зіва – створення алгоритму LZW Практичне впровадження - реалізація алгоритму LZW в програмі compress 1981 – начало патентования программного обеспечения в США, бурный рост количества работ по сжатию данных Популярність алгоритмів LZ стилю – стандарт модема V. 42 bis, протокол передачи даних ZModem, формати GIF, TIFF, ARC Лютий 2011 року – виходить шоста бета-версія Win. Rar 4. 0
4. ТЕРМІНОЛОГІЯ Біт (англ. binary digit; также игра слов: англ. bit — немного) Дані – інформація в цифровому вигляді Об’єм даних – вимірюється в бітах R-бітний елемент – сукупність R бітів, має 2 R можливих значень (стану) Байт – 8 -біт Кілобайт – 210 = 1024 байт Мегабайт – 220 = 1 048 576 байт
4. 1 ТЕРМІНОЛОГІЯ Блок – кінцева послідовність цифрової інформації Потік даних – послідовність з невідомими границями Надмірність - перевищення кількості інформації над його інформаційною ентропією. Любі дані з надмірністю можна стиснути Дані, в яких немає надмірності, стиснути не можна
4. 2 ТЕРМІНОЛОГІЯ Текст – послідовність вхідних даних Алфавіт – повний набір символів Стиск даних — процедура перекодування даних, відбувається з метою зменшення їх обсягу. Префікс – службовий код Стиск буває без втрат чи з втратами. Однопрохідний алгоритм Блоковий алгоритм
4. 3 ТЕРМІНОЛОГІЯ Класифікація методів архівації Статистичні Інкрементні Текстової підстановки Стиск без втрат звичайно використовується при обробці комп’ютерних програм та даних, рідко — для скорочення обсягу звукової, фото- и відеоінформації.
4. 4 ТЕРМІНОЛОГІЯ Архівація - стиск одного або більше файлів з метою економії пам’яті та розміщення стиснутих данних в одном архівному файлі. Архівація даних - зменшення фізичних розмірів файлів, в яких зберігаються дані, без інформаційних втрат Архівація відбувається в таких випадках: Коли необхідно створити резервні копії найбільш ціних файлів Коли необхідно вивільнити місце на диску Коли необхідно передавати файли по E-mail Архівний файл являє собою набір з декількох файлів (одного файла), розташованих в стиснутому вигляді в єдиний файл, з якого їх можна при необхідності вилучити у початковому вигляді.
ПИТАННЯ ДО АУДІТОРІЇ: В чому складається основна різниця між стиском та архівацією даних?
4. 5 ТЕРМІНОЛОГІЯ Кодек (англ. от coder/decoder) — пристрій чи програма, здатна виконувати пряме (стиск) та зворотне перетворення (відновлення) даних чи сигналу Коефіцієнт стиску – відношення розміру вихідного (стиснутого) блоку даних до розміру вхідного (нестиснутого) блоку Фактор сжатия – величина зворотня коефіцієнту стиску = розмір вхідного (нестиснутого) блоку / розмір вихідного (стиснутого) блоку
ПРИКЛАД ЗАСТОСУВАННЯ Ми можемо достатньо легко видаліти з осмысленного тексту частину букв, при цьому практично не перекрутит його зміст та інформативність 128 символів М мжм дстчн лгк длть з смслнго ткст чсть бкв пр тм прктчск н скзв г смсл нфрмтвнсть 66 символів К = 66/128 = 0, 51 Ф=1/К=1, 9
5. ВИЗНАЧЕННЯ ІНФОРМАЦІЇ Ансамбль повідомлень хi, i=(1, …M) Апріорні ймовірностями Pi Міра кількості інформації Iі = log 2 (1/Р(xi)) = - log 2 Р(xi) Інформація 1) ненегативна; 2) аддитивна Ентропія ансамблю повідомлень: .
5. 1 ВИЗНАЧЕННЯ ІНФОРМАЦІЇ Вартість кодування Надмірність кодування R = C - H.
Умовна власна інформація повідомлення х при відомому повідомленні y: I(x|y) = -log(p(x|y)) Умовна ентропія ансамблю Х при повідомленні y (середня умовна ентропія): Умовна ентропія ансамблю Х щодо ансамблю Y
5. 2 НАДМІРНІСТЬ ІНФОРМАЦІЇ Приклади надмірності (X={“так”, ”ні”, ”не знаю”}) X={“т”, ”н”, ”? ”} A={00, 01, 10} A={00, 01, 1}
н. пр. м. р в. к. н. ть вс. гл. сн. . б. кв. , іл. ви. ин. ть ка. ду. тр. ть. бу. ву, або відкидат. . . закінчен. . кожн. . . слов. ,
6 ВИКОРИСТАННЯ АРХІВАЦІЇ • Криптографія. Системи зв'язку Системи зберігання інформації
ВИКОРИСТАННЯ СТИСКУ дзвонимо у двері умовним дзвінком; посилаємо телеграму; працюємо на комп'ютері; переносимо в записну книжку адреси й телефони з дюжини клаптиків паперу; намагаємося засунути у валізу якнайбільше речей; конспектуємо лекції; працюємо “морзянкою”
СИСТЕМИ ЗВ'ЯЗКУ абетку Морзе протокол MNP 5 фірми Microcom протокол CCITT V 42. bis
СИСТЕМИ ЗБЕРІГАННЯ ІНФОРМАЦІЇ Compress в UNIX, SQUEEZE в CP/M PKZIP, ARJ, LHA, HA RAR, AIN, ACB архіватори, що саморозпаковуються PKLITE, LZEXE, DIET, EXEPACK системні утиліти стиску дискового простору програми перетворення й показу форматів відеозображень PCXVIEW, GIFVIEW, BITMAP, JPGVIEW, Quick. Time
ВОТПРСТОЙПРМЕРСЖАТИЯДННЫХ Зв’язок криптології та стиску інформації: стислий текст складніше піддається перехопленню при передачі по лінії зв'язку і його сутужніше виявити при зберіганні (але не слід забувати що при цьому зростає небезпека поширення помилки); стиск інформації з варійованими залежно від ключа параметрами може розглядатися як один з нетрадиційних програмних криптоалгоритмов.
7 МОДЕЛЮВАННЯ ДЖЕРЕЛА ІНФОРМАЦІЇ • Джерело Бернулі Джерело Маркова x 1 . . . xi-1 xi xi+1 . . . x. L x 1 p 1, 1 . . . p 1, i . . . p 1, L . . . xj-1 pj-1, 1 . . . pj-1, i . . . pj-1, L xj pj, 1 . . . pj, i . . . pj, L xj+1 pj+1, 1 . . . pj+1, i . . . pj+1, L . . . x. L p. L, 1 . . . p. L, i . . . p. L, L
ТИПИ ІНФОРМАЦІЇ
КОНТРОЛЬНІ ПИТАННЯ 1. Пояснити в чому полягає актуальність проблеми стиску інформації та шляхи її вирішення. 2. Назвати передпосилки виникнення архівації 3. Привести основні параметри архіваторів 4. Привести класифікацію методів архівації 5. Розкрити поняття кількості інформації 6. Розкрити поняття ентропії, відносної ентропії 7. Розкрити поняття вартості кодування 8. Розкрити поняття надмірності інформації 9. Пояснити основні види надмірності інформації 10. Привести сфери використання архіваторів 11. Пояснити зв’язок криптології та стиску інформації 12. Використання стиску інформації в системах зв'язку 13. Пояснити моделювання джерела інформації за Бернулі 14. Пояснити моделювання джерела інформації за Марковим 15. Привести класифікацію типів інформації
Лекция 1. Архивация и сжатие данных.ppt