Создание сайтов

Формат tar и gzip: редактирование без пережатия

Tar — архиватор ленточных накопителей

Для понимания того как работает формат, пожалуй нужна небольшая историческая справка.

Tar (tape archive) — формат записи данных, появился впервые в 1979 году, последний раз был стандартизирован POSIX IEEE в 2001. Это очень старый формат, который был призван собирать данные с ленточных накопителей (магнитных лент) в последовательном порядке.

Абсолютно никакого сжатия данных в нём не было предусмотрено, какое там сжатие в 1979 году.:-)

Однако в средах современных ОС (будь то UNIX или Windows), де факто используют дополнительное сжатие сторонними утилитами, чаще всего это стандарты близкие к ZIP.
Потому в обиходе даже прижилось соответствующее файловое расширение — .tar.gz. Всё просто — это формат tar сжатый утилитой Gzip.

svoistva-faila

Я использовал смешанные данные: картинки, текстовые документы, аудио, и учитывая скорость, 50% — это очень хороший показатель сжатия.

Плюсы формата tar

Главным плюсом архивирования данных в tar является сохранение в архиве не только файловой структуры, но и сохранение данных о владельце файла, времени создания, и других временных метках.

filezilla-prava

Filezilla: при развертывании архива все указанные права сохранятся.

Таким образом, развертывая файл бэкапа tar или tar gzip у себя на FTP, вы сохраните те права для каталогов и файлов, что и были первоначально, а также имена владельцев групп.
Кроме того, большим плюсом является скорость архивирования в taz.gz, при прочих равных она на порядок выше чем у половины современных форматов.

Где используется формат?

На сегодняшний день формат применяться в UNIX системах, Linux, и, как следствие, на большинстве серверов и FTP.

Кстати, ленточные накопители как класс устройств отнюдь не канули в лету. Практически все производители дисковых и флеш накопителей также предлагают решения, основанные на технологии ленточных накопителей.

Содержать «библиотеку» с парой петабайт на ленточных накопителях в десяток раз дешевле чем на дисковых.
DELL и HP так и вовсе имеют модели стриммеров(считывающее устройство) и кассет, продаваемые в розницу, без предзаказа, и даже онлайн.

strimmer-tape-dell

Самый бюджетный стример DELL и комплект ленты (картриджей).

Редактирование tar или gzip без пережатия

Итак, уже понятно, что данные, записанные в формате tar, записываются в контейнер последовательно, и считываются они в том же порядке.
Соответственно, чтобы получить доступ к файлу, нужно извлечь весь поток.
Такая особенность формата tar или tar.gz делает конструктивно невозможным редактирование этого формата файла без пережатия архива.

redaktirovanie-tar-bez-upakovki

Потому при открытии .tar архива кнопка «Добавить в архив» в архиваторах WinRar и 7-Zip будет неактивна.

Что делать?

Если вам нужно отредактировать файлы в tar (tar.gz) архиве без пережатия —
выход только один — распаковать весь архив полностью, а затем запаковать его снова.
Обычно в этом случае я пакую в другом формате, например, в 7-zip, на максимально высоком уровне сжатия.
Раз уже пережимать архив — почему бы не сэкономить лишнее пространство?:-)

Еще один совет — если файл архива действительно очень массивный, убедитесь в том, что на момент распаковки у вас отключен антивирус и другие следящие утилиты, а также проверьте чтобы места на вашем накопителе хватало с запасом, а не байт-в-байт.