
Общие сведения об архивации файлов.ppt
- Количество слайдов: 9
Общие сведения об архивации файлов Архивация файлов – это упаковка файла или группы файлов в один архивный файл, в котором данные либо остаются в исходном виде, либо подвергаются обратимому сжатию. Сжатие данных – это процесс преобразования данных, хранящихся в файле, к виду, при котором уменьшается избыточность в её представлении и соответственно требуется меньший объём памяти для хранения. Способы устранения избыточности данных: 1) RLE (Run Length Encoding) алгоритм; 2) KWE (Keyword Encoding ) алгоритм; 3) алгоритм Хаффмана; 4) различные комбинированные или «синтетические» алгоритмы.
Основные алгоритмы сжатия Алгоритм RLE использует принцип выявления групп подряд идущих одинаковых символов и замены их на пару кодов «код символа; число повторов» . Как правило, в байте-счетчике старшие два бита содержат единицы, а в младших шести битах хранится число повторов. Пример: Исходная последовательность: 3; 3; 12; 12; 0; 0. Сжатая информация: 3; 2; 12; 3; 0; 4. Коэффициент сжатия: 6/9*100% = 67%. Т. к. алгоритм даёт лучший эффект сжатия при бόльшей длине повторяющихся цепочек, алгоритм эффективен при сжатии графических файлов с большими одноцветными участками изображения. Алгоритм KWE предполагает использование словаря, в котором каждой лексической единице соответствует код меньшей и фиксированной длины. Примером лексической единицы может быть последовательность символов, справа и слева ограниченная пробелами или символами конца абзаца. Эффективность сжатия увеличивается с ростом объёма кодируемых данных.
Алгоритм Хаффмана предполагает кодирование не байтами, а битовыми группами. Процедура сжатия состоит из трёх шагов: 1) выявление частоты повторения каждого из встречающихся символов; 2) построение кодового дерева символов по полученной статистике по принципу: чем чаще встречается символ, тем меньшим количеством битов он кодируется; 3) формирование сжатого сообщения и таблицы соответствия. Пример: Символ Частота Битовый код Размер исходного текста: 37 байт. повторения A 10 00 B 8 01 Сжатая информация: 93 бит ≈ 12 байт (без учёта длины таблицы соответствия). C 6 100 Коэффициент сжатия: 12/37=32%. D 5 101 E 4 110 F 4 111 Алгоритм малоэффективен для файлов маленьких размеров из-за необходимости хранение таблицы соответствия.
Оглавление архивного файла 1) позволяет узнать, какие файлы содержаться в архиве; 2) хранит для каждого файла архива информацию: a) b) c) d) d) e) f) имя файла; сведения о каталоге, в котором содержится файл; дата и время создания или последней модификации файла; размер исходного файла и в архиве; код циклического контроля для каждого файла, используемый для проверки целостности архива.
Цели архивации данных ü обеспечение более компактного размещения информации на диске; ü сокращение времени копирования файлов на диски; ü сокращение времени и стоимости передачи информации по каналам связи в компьютерных сетях; ü упрощение переноса группы файлов с одного компьютера на другой; ü защита информации от несанкционированного доступа; ü защита от заражения файлов компьютерными вирусами.
Функции современных архиваторов Базовые: ü извлечение файлов из архивов; ü создание новых архивов; ü добавление файлов в имеющийся архив; ü создание самораспаковывающихся архивов; ü создание многотомных архивов; ü создание непрерывных архивов; ü тестирование целостности структуры архивов; ü полное или частичное восстановление поврежденных архивов; ü защита архивов от просмотра и несанкционированной модификации. Дополнительные (сервисные) : ü просмотр файлов различных форматов без извлечения их из архива; ü поиск файлов и данных внутри архива; ü выбор и настройка коэффициента сжатия информации; ü криптографическая защита архивной информации.
Типы архивов Обычный архив форматов RAR, ZIP, CAB, ARJ, LZH, TAR, GZ, ACE, UUE и др. Самораспаковывающийся (SFX, от англ. Sel. F-e. Xtracting) архив — это архив, к которому присоединен исполнимый модуль, позволяющий извлекать файлы простым запуском архива как обычной программы. Особенности: a) SFX-архивы обычно имеют расширение. EXE и для извлечения содержимого не требуют дополнительных внешних программ; b) используются для распространения своих собственных программ и для передачи архива адресату, у которого может не оказаться соответствующего архиватора. Многотомный архив – последовательность архивных файлов (томов). Особенности: a) при создании данного архива в Win. Rar первый том в последовательности имеет обычное расширение. rar, а расширения последующих томов нумеруются как. r 00, . r 01, r 02 и т. д. ; b) тома могут быть также непрерывными и самораспаковывающимися; c) архивные тома не допускают последующего добавления, обновления или удаления файлов; d) используются для сохранения большого архива на нескольких носителях информации.
Типы архивов Непрерывный (Solid) архив — это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Особенности: a) позволяет увеличить степень сжатия; b) обновление непрерывных архивов происходит медленнее, чем обычных, поскольку для извлечения одного файла из данного архива необходимо проанализировать все предыдущие заархивированные файлы; c) при повреждении какого-либо файла не удастся извлечь и все файлы, следующие после него; d) используются в случаях, когда степень сжатия важнее скорости сжатия, архив редко обновляется и нет необходимости часто извлекать файлы из архива.
Вопросы для самостоятельного изучения 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Чем отличаются архивы RAR от архивов ZIP Что такое том, как определить размер тома? Возможности Win. RAR Несколько способов открытия программы архиватора Как создать архив и извлечь файлы из архива в текущей папке Проводника? Как создать архив и извлечь файлы из архива в программе – архиваторе? Работа с архивами в FAR’е, в том числе с помощью командной строки. Что такое консольная версия программы – архиватора? Какие существуют методы сжатия? Какие существуют методы обновления архива? В каком случае используется размер тома по автоопределению? Параметры архивации. Для чего используется кнопка «Обзор» в окне «Имя и параметры архива»
Общие сведения об архивации файлов.ppt