АРХИВАТОРЫ
Сжатие информации – это процесс преобразования информации, хранящейся в файле, путем уменьшения избыточности данных. Целью этого процесса является уменьшения обьема, занимемого данными.
Архивный файл – это специально созданный файл, содержащий в себе один или несколько файлов в сжатом виде.
достоинства | недостатки |
уменьшение занимаемого объема | возможность потери данных при упаковке и распаковке |
упрощение хранения и сортировки имеющихся данных | требуется специальное программное обеспечение (в некоторых случаях – оборудование (MPEG, CD-I)) |
сокращение времени передачи данных по каналам связи | загрузка ресурсов ПК на сжатие/распаковку данных, снижение быстродействия |
позволяет защитить данные от несанкционированного доступа (при использовании пароля) | невозможность непосредственно запускать сжатые программы на выполнение. |
Степень сжатия: Kc=Vc/Vo*100%
Kc – коэффициент сжатия, Vc – объем сжатого файла, Vo – исходный объем файла.
Степень сжатия зависит от:
1) используемой пограммы – архиватора,
2) метода сжатия,
3) типа исходного файла: текстового, графического, видео, звукового и т.д.
Программы, осуществляющие упаковку и распаковку файлов называются архиваторами. Наиболее распространенными являются: ARJ, ZIP, RAR. Расширение архивных файлов совпадает с названием использованного для их создания архиватора.
Архиваторы позволяют создавать самораспаковывающиеся архивные файлы, т.е. для их распаковки не требуется запуска программы-архиватора, т.к. они сами содержат программу распаковки. Эти архивы называются SFX-архивы
(SelF-eXtracting). Расширение таких файлов *.EXE.
Принципы сжатия информации
|
В любом тексте встречаются повторяющиеся символы. Возможно указать один символ и число повторений. Еще выше эффективность этого алгоритма применительно к графическим файлам. Если взглянуть на монитор, то можно видеть очень много повторяющихся точек одного цвета. На этом принципе сжатия информации основан формат графических файлов PCX. Современные архиваторы выделяют, не только повторяющиеся символы, но и цепочки символов, отдельные слова.
Если в тексте используются не все символы алфавита ПК, то для их кодирования можно использовать в место одного байта, 8-ми бит, меньше число. Этот принцип используется в телеграфном аппарате, где используются только русские заглавные буквы, для их представления достаточно 5 бит, что позволяет записать в два байта три символа.
1-й символ | 2-й символ | 3-й символ |
3. В следующим принципе используется закономерность что в тексте буквы встречаются с разной частотой. Например в этом тексте пробел самый распространенный символ, очень часто встречаются символы «а», «и». Эти часто встречающиеся символы можно представлять короткой комбинацией битов, остальные символы возможно кодировать более длинной последовательностью. Например:
Символ пробел «» | ||||||||
Символ «а» | ||||||||
Символ «и» | ||||||||
? | ? | ? | ? | ? | ? | Остальные символы кодовой таблицы |
|
4. Физически ПК выделяет место для размещения файлов на диске по кластерам - блоками по 4 кБ. Меньше выделить невозможно. Например если файл имеет размер 8193 байта (8 кБ и 1 байт), физически он будет занимать 16 кБ или 16384 байта. Объединение группы файлов в один позволяет сэкономить на этих остатков. При упаковки маленьких файлов это дает большую экономию.
Файл. 3 кБ | 1 кБ | Файл 1 кБ | 3 кБ | Файл 2 кБ | 2 кБ | ||||||
2 кБ | |||||||||||
Длина объединенного файла 6 кБ | |||||||||||
Итого, при отдельном размещении файлов не используются 6 кБ, что составляет 100% от содержания файлов. Во втором случае неиспользуемыми остается 2 кБ, 33%.
Архиватор zip
Запаковка файлов pkzip [ключи] <имя архива> [пути файлов]
Ключи: -rp архивация с подкаталогами с сохранением структуры
-s PWD защита архива паролем (PWD)
-a добавить файлы в архив
-m переместить файлы в архив
-v просмотр содержимого архива
Если производится архивация всех файлов каталога, то обязательно указывать маску *.*
Действие | Команда |
Запаковать все файлы текущего каталога | pkzip test *.* |
Запаковать перечисленные файлы текущего каталога | pkzip test *.doc |
Запаковать все файлы из текущего каталога и из всех его подкаталогах | pkzip -rp arhiv |
Запаковать файлы с паролем. Для примера введен пароль 1234 | pkzip -s1234 test |
Распаковка файлов pkunzip [ключи] <имя архива> [имена файлов]
Ключи: -d распаковка с подкаталогами с сохранением структуры
-sPWD пароль архива (PWD)
|
Действие | Команда |
Распаковать содержимое архива в текущий каталог | pkunzip test |
Распаковать только указанные файлы | pkunzip test *.txt |
Распаковать архив с восстановлением структуры запакованных каталогов | pkunzip -d arhiv |
Распаковать архив запакованный с паролем. | pkunzip -s1234 test |
Архиватор arj
arj <команда> [ключи] <имя архива> [имена файлов]
Для архиватора arj один файл выполняет операции и распаковки и запаковки.
Команды: a архивация
e распаковка без сохранения структуры каталогов
x распаковка с сохранением структуры
l просмотр содержимого архива
m переместить файлы в архив
d удалить файлы из архива
Ключи: -r упаковка с подкаталогами с сохранением структуры
-v[vol] разбивка архива на тома с объемом vol(если указан)
размер для стандартных дискет (360, 720, 1200, 1440) указывается в килобайтах, размер нестандартных дискет указывается в байтах
-v указывается при распаковке многотомного архива
-g PWD пароль архива (PWD)
Запаковка файлов
Действие | Команда |
Запаковать все файла текущего каталога | arj a test |
Запаковать перечисленные файлы текущего каталога | arj a test *.txt |
Запаковать все файлы из текущего каталога и из всех его подкаталогах | arj a -r arhiv |
Запаковать файлы с разбивкой по дискетам. Первый архив создается с именем arhiv.arj, следующие будут иметь расширения a01, a02 и т.д. | arj a -v360 arhiv |
Распаковка файлов
Действие | Команда |
Распаковать содержимое архива в текущий каталог | arj e test |
Распаковать только указанные файлы | arj e test *.txt |
Распаковать архив с восстановлением структуры запакованных каталогов | arj x arhiv |
Распаковать многотомный архив | arj x -v arhiv |