Los archivadores son programas que pueden comprimir información en archivos. Los archivadores modernos le permiten combinar varios archivos en un solo archivo y ver el contenido de dichos archivos. El tamaño del archivo creado con su ayuda resulta ser mucho menor que el tamaño del archivo original.
Instrucciones
Paso 1
El principio general de funcionamiento de la mayoría de los archivadores se basa en un algoritmo desarrollado por los investigadores A. Lampel y J. Ziv en los años 80 del siglo pasado. El algoritmo creado por Ziv y Lampel permite calcular código duplicado en un archivo y así reducir su tamaño. Para ello, se compila un diccionario a partir de secuencias de datos. Por ejemplo, el código binario del archivo contiene la siguiente combinación: 10111011101110110011. Es fácil ver que el código 1011 se repite varias veces en él. El archivador detecta dicho código y lo escribe en el archivo solo una vez, y al descomprimirlo, vuelve a sustituir el código en los lugares necesarios del archivo.
Paso 2
Qué tan bien comprimirá el archivo el archivador depende del tamaño del diccionario de origen. Si el diccionario es demasiado grande, afectará el tamaño del archivo. Si el tamaño del diccionario es demasiado pequeño, pueden producirse errores en el archivo creado. Puede aumentar la relación de compresión de un archivo utilizando la codificación de entropía (el llamado método Huffman). Con la codificación de entropía, los fragmentos binarios repetidos se escriben utilizando un código corto. En los archivadores modernos, la codificación de entropía se utiliza como método de codificación adicional.
Paso 3
En los sistemas Unix, gzip es el archivador más popular. Este archivador comprime los datos sin pérdidas y se basa en el algoritmo Deflate. La compresión de archivos aquí ocurre en dos enfoques: primero, se reemplazan los fragmentos de código duplicados y luego los caracteres en ellos se reemplazan con nuevos caracteres utilizando el método Huffman. Los archivadores para sistemas Unix tienen una serie de desventajas. Están dirigidos principalmente a archivos que constan de muchos archivos, por lo que descomprimir un solo archivo es difícil. Esto se debe a que los archivadores de Unix ven un archivo como una matriz continua de todos los archivos empaquetados en él. El archivo se forma sobre la base de la información contenida en cada archivo.
Paso 4
En los sistemas Windows, los archivadores como WinZip, 7-zip y WinRAR son comunes. A diferencia de los sistemas Unix, estos archivadores se centran en trabajar tanto con archivos individuales como con archivos continuos que constan de muchos archivos. La mayoría de los archivadores de Windows modernos "comprenden" muchos formatos de archivo, admiten el cifrado y son capaces de comprimir archivos muy grandes (por ejemplo, el tamaño máximo de archivo para el archivador WinRAR es de más de ocho mil millones de gigabytes).