Принципы сжатия информации




АРХИВАТОРЫ

Сжатие информации – это процесс преобразования информации, хранящейся в файле, путем уменьшения избыточности данных. Целью этого процесса является уменьшения обьема, занимемого данными.

Архивный файл – это специально созданный файл, содержащий в себе один или несколько файлов в сжатом виде.

достоинства недостатки
уменьшение занимаемого объема возможность потери данных при упаковке и распаковке
упрощение хранения и сортировки имеющихся данных требуется специальное программное обеспечение (в некоторых случаях –­ оборудование (MPEG, CD-I))
сокращение времени передачи данных по каналам связи загрузка ресурсов ПК на сжатие/распаковку данных, снижение быстродействия
позволяет защитить данные от несанкционированного доступа (при использовании пароля) невозможность непосредственно запускать сжатые программы на выполнение.

 

Степень сжатия: Kc=Vc/Vo*100%

Kc – коэффициент сжатия, Vc – объем сжатого файла, Vo – исходный объем файла.

 

Степень сжатия зависит от:

1) используемой пограммы – архиватора,

2) метода сжатия,

3) типа исходного файла: текстового, графического, видео, звукового и т.д.

 

Программы, осуществляющие упаковку и распаковку файлов называются архиваторами. Наиболее распространенными являются: ARJ, ZIP, RAR. Расширение архивных файлов совпадает с названием использованного для их создания архиватора.

Архиваторы позволяют создавать самораспаковывающиеся архивные файлы, т.е. для их распаковки не требуется запуска программы-архиватора, т.к. они сами содержат программу распаковки. Эти архивы называются SFX-архивы
(SelF-eXtracting). Расширение таких файлов *.EXE.

 


Принципы сжатия информации

 

В любом тексте встречаются повторяющиеся символы. Возможно указать один символ и число повторений. Еще выше эффективность этого алгоритма применительно к графическим файлам. Если взглянуть на монитор, то можно видеть очень много повторяющихся точек одного цвета. На этом принципе сжатия информации основан формат графических файлов PCX. Современные архиваторы выделяют, не только повторяющиеся символы, но и цепочки символов, отдельные слова.

Если в тексте используются не все символы алфавита ПК, то для их кодирования можно использовать в место одного байта, 8-ми бит, меньше число. Этот принцип используется в телеграфном аппарате, где используются только русские заглавные буквы, для их представления достаточно 5 бит, что позволяет записать в два байта три символа.

                                 
                                 
1-й символ 2-й символ 3-й символ

 

3. В следующим принципе используется закономерность что в тексте буквы встречаются с разной частотой. Например в этом тексте пробел самый распространенный символ, очень часто встречаются символы «а», «и». Эти часто встречающиеся символы можно представлять короткой комбинацией битов, остальные символы возможно кодировать более длинной последовательностью. Например:

                Символ пробел «»
                Символ «а»
                Символ «и»
    ? ? ? ? ? ? Остальные символы кодовой таблицы

 

4. Физически ПК выделяет место для размещения файлов на диске по кластерам - блоками по 4 кБ. Меньше выделить невозможно. Например если файл имеет размер 8193 байта (8 кБ и 1 байт), физически он будет занимать 16 кБ или 16384 байта. Объединение группы файлов в один позволяет сэкономить на этих остатков. При упаковки маленьких файлов это дает большую экономию.

Файл. 3 кБ 1 кБ Файл 1 кБ 3 кБ Файл 2 кБ 2 кБ
         
      2 кБ    
Длина объединенного файла 6 кБ      
                       

Итого, при отдельном размещении файлов не используются 6 кБ, что составляет 100% от содержания файлов. Во втором случае неиспользуемыми остается 2 кБ, 33%.


Архиватор zip

 

Запаковка файлов pkzip [ключи] <имя архива> [пути файлов]

Ключи: -rp архивация с подкаталогами с сохранением структуры

-s PWD защита архива паролем (PWD)

-a добавить файлы в архив

-m переместить файлы в архив

-v просмотр содержимого архива

Если производится архивация всех файлов каталога, то обязательно указывать маску *.*

 

Действие Команда
Запаковать все файлы текущего каталога pkzip test *.*
Запаковать перечисленные файлы текущего каталога pkzip test *.doc
Запаковать все файлы из текущего каталога и из всех его подкаталогах pkzip -rp arhiv
Запаковать файлы с паролем. Для примера введен пароль 1234 pkzip -s1234 test

Распаковка файлов pkunzip [ключи] <имя архива> [имена файлов]

Ключи: -d распаковка с подкаталогами с сохранением структуры

-sPWD пароль архива (PWD)

 

Действие Команда
Распаковать содержимое архива в текущий каталог pkunzip test
Распаковать только указанные файлы pkunzip test *.txt
Распаковать архив с восстановлением структуры запакованных каталогов pkunzip -d arhiv
Распаковать архив запакованный с паролем. pkunzip -s1234 test

Архиватор arj

 

arj <команда> [ключи] <имя архива> [имена файлов]

Для архиватора arj один файл выполняет операции и распаковки и запаковки.

 

Команды: a архивация

e распаковка без сохранения структуры каталогов

x распаковка с сохранением структуры

l просмотр содержимого архива

m переместить файлы в архив

d удалить файлы из архива

 

Ключи: -r упаковка с подкаталогами с сохранением структуры

-v[vol] разбивка архива на тома с объемом vol(если указан)

размер для стандартных дискет (360, 720, 1200, 1440) указывается в килобайтах, размер нестандартных дискет указывается в байтах

-v указывается при распаковке многотомного архива

-g PWD пароль архива (PWD)

 

Запаковка файлов

Действие Команда
Запаковать все файла текущего каталога arj a test
Запаковать перечисленные файлы текущего каталога arj a test *.txt
Запаковать все файлы из текущего каталога и из всех его подкаталогах arj a -r arhiv
Запаковать файлы с разбивкой по дискетам. Первый архив создается с именем arhiv.arj, следующие будут иметь расширения a01, a02 и т.д. arj a -v360 arhiv

Распаковка файлов

Действие Команда
Распаковать содержимое архива в текущий каталог arj e test
Распаковать только указанные файлы arj e test *.txt
Распаковать архив с восстановлением структуры запакованных каталогов arj x arhiv
Распаковать многотомный архив arj x -v arhiv

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: