ARCHIVE.ppt
- Количество слайдов: 14
Архивация
Вопросы 1. Для чего применяют сжатие данных? 2. Избыточность данных и использование её при сжатии данных? 3. Три способа уменьшения избыточности данных? 4. В каких случаях метод сжатия обратим? 5. Теоремы сжатия данных? 6. Эффективность методов сжатия и типы данных? 7. Архиваторы? 8. «Классические» форматы сжатия? 9. Самораспаковывающийся архив? 10. Пример алгоритма сжатия? 11. Характеристики архиваторов?
Как хранение, так и передача информации обходятся участникам информационного процесса недешево. В связи с этим, регулярно возникает необходимость сжимать данные перед тем, как размещать их в архивах или передавать по каналам связи. Соответственно, существует и обратная необходимость восстановления данных предварительно уплотненных архивов. из
Теоретические основы сжатия данных Характерной особенностью большинства “классических” типов данных, с которыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Например, у видеоданных степень избыточности обычно в несколько раз больше, чем у графических данных, а степень избыточности графических данных в несколько раз больше, чем текстовых.
Для человека избыточность информации нередко связана с представлением о ее качестве, поскольку избыточность, как правило, улучшает восприятие, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, восстановление поврежденного графического материала, чтение текстов в условиях недостаточной освещенности и т. п. ). При обработке информации избыточность также играет важную роль.
Однако, когда речь заходит не об обработке, а о хранении готовых документов или их передаче, то избыточность можно уменьшить, что дает эффект сжатия данных. Если методы сжатия информации применяют к готовым документам, то нередко термин сжатие данных подменяют термином архивация данных, а программные средства, выполняющие эти операции, называют архиваторами
Обратимость сжатия Несмотря на изобилие алгоритмов сжатия данных, теоретически есть только три способа уменьшения их избыточности. Это либо изменение содержания данных, либо изменение их структуры, либо и то и другое вместе. Если при сжатии данных происходит изменение их содержания, метод сжатия необратим и при восстановлении данных из сжатого файла не происходит полного восстановления исходной последовательности. Если при сжатии данных происходит только изменение их структуры, то метод сжатия обратим.
Алгоритмы обратимых методов При исследовании методов сжатия данных следует иметь в виду существование следующих доказанных теорем. 1. Для любой последовательности данных существует теоретический предел сжатия, который не может быть превышен без потери части информации. 2. Для любого алгоритма сжатия можно указать такую последовательность данных, для которой он обеспечит лучшую степень сжатия, чем другие методы. 3. Для любого алгоритма сжатия можно указать такую последовательность данных, для которой данный алгоритм вообще не позволит получить сжатия.
Таким образом, обсуждая различные методы сжатия, следует иметь в виду, что наивысшую эффективность они демонстрируют для данных разных типов и разных объемов. Программные средства сжатия данных “Классическими” форматами сжатия данных, широко используемыми в повседневной работе с компьютером, являются форматы. ZIP, . RAR, . ARJ.
Архивирование- это упаковка (сжатие) файла или группы файлов с целью уменьшения места, занимаемого на диске. Архивирование используют при хранении копий на дискетах или на дисках. n Архивирование используют для переноса файлов, размер которых превышает емкость дискеты n
Архиваторы n n Для упаковки файлов используются служебные программы архиваторы, которые вместо одного или нескольких файлов создают один архивный файл в том или ином формате(arj; zip; rar). Почти все архиваторы дают возможность создать самораспаковывающийся архив, т. е. файл с расширением. EXE. Он создается тогда, когда у потребителя нет программных средств для извлечения исходных данных, и готовится на базе обычного архива путем присоединения к нему небольшого программного модуля.
Принципы одного из алгоритмов архивации Архиватор находит похожие фрагменты из нескольких символов и заменяет их каким-то кодом, эта кодировка запоминается и при раскрытии архива информация восстанавливается n Например, в тексте часто встречается слово «Компьютер» , вместо 9 символов - 9 байт (каждый символ - это байт) будет использован один символ - 1 байт n Чем чаще встречается повторяющаяся конструкция - тем больше уплотнение при архивации n
RAR n n Один из архиваторов, который имеет оконный интерфейс. С интерфейсом легче работать, т. к. все необходимые функции находятся в меню и знание ключей не требуется
Характеристики архиваторов: степень сжатия файла (отношение размера упакованного файла к размеру исходного файла); n скорость работы; n сервис (набор функций архиватора). n