GZIP a BZIP2

Anonim

GZIP vs BZIP2

GNU zip (také známý jako GZIP) je softwarová aplikace s cílem komprimovat soubory. Původně bylo zamýšleno nahradit kompresní program používaný v raných unixových systémech - používaný v projektu GNU (projekt svobodného softwaru).

BZIP2 je algoritmus komprese dat bez otevřených zdrojových jednotek - v podstatě třída algoritmů komprese dat, která umožňuje, aby původní data komprimovaného souboru byly kompletně rekonstruovány z komprimovaných dat.

GZIP je založen na algoritmu známém jako DEFLATE. Jedná se také o bezztrátový algoritmus komprese dat. Používá algoritmus LZ77 i kódování Huffman. GZIP se v podstatě týká formátu souboru se stejným názvem. Tento formát je záhlaví 10 bajtů obsahující kouzelné číslo (což znamená číselnou nebo textovou hodnotu, která se nikdy nezmění a je použita k označení formátu nebo protokolu souboru, nepomenovaná číselná hodnota, která se nikdy nezmění, nebo odlišné hodnoty, které nelze zaměnit pro něco jiného), další záhlaví, které mohou nebo nemusí být skutečně nutné (například původní název souboru), tělo, které obsahuje DEFLATE-komprimovanou užitečnou zátěž (což jsou údaje, které hlavičky nesou) a 8-bytový zápatí který obsahuje kontrolní součet CRC-32, stejně jako skutečnou délku původních nekomprimovaných dat.

Existuje celá řada kompresních technik, které formát BZIP2 používá, které jsou uspořádány na sobě v několika vrstvách. Vyskytují se ve velmi odlišném pořadí: kódování v délce trvání (což je jakákoliv sekvence čtyř až 255 duplikátních symbolů, která je nahrazena prvními čtyřmi symboly a délka kódování, která se opakuje mezi 0 a 251), transformace Burrows-Wheeler (což je reverzibilní block-sort, který tvoří hlavní jádro BZIP2), Přesun na frontu (opouští velikost zpracovávaného bloku nezměněný), kódování délky běhu (které se skládá z dlouhých řetězců symbolů - obvykle nula - které neustále opakují se na výstupu a jsou nahrazeny symbolem a sekvencí dvou kódů), Huffmanovo kódování (což je proces, který nahrazuje symboly pevné délky 8 bitových bajtů se změněnými kódy délky), vícenásobné kódování Hoffmanem (které sestávají z vícenásobné Hoffmanovy tabulky stejné velikosti), Unary base 1 kódování, Delta kódování a Sparse bitové pole.

Souhrn:

1. GZIP je bezplatná aplikace používaná pro kompresi souborů; BZIP2 je algoritmus pro kompresi dat bez ztrát, který umožňuje načíst původní data komprimovaného souboru.

2. GZIP se skládá z 10bajtové hlavičky, volitelných záhlaví, těla a 8bajtového zápatí; BZIP2 se skládá z nejméně devíti vrstev kompresních technik.