Ficheros comprimidos: Todo lo que siempre quiso saber.
Los ficheros comprimidos, que tan útiles resultan para manejar información, suelen ser un misterio para los usuarios menos experimentados. Esta semana intentamos desvelar todos sus secretos.
Este glorioso tutorial está destinado a los usuarios noveles que contemplan horrorizados como tantas y tantas páginas del World Wide Web dan por sentado que se conoce absolutamente todo lo relativo a la compresión de ficheros, sin explicar nunca el cómo, el porqué [ni el cuándo ni el dónde]. Es por ello que os ofrecemos a continuación una pequeña guía o recorrido con el modesto objetivo de daros suficientes pistas como para que podáis luego ser autosuficientes en el manejo de este tipo de archivos.
¿QUÉ ES UN FICHERO COMPRIMIDO?
Básicamente, se trata de obtener un archivo cuya longitud en bytes [a veces llamada "peso"] sea inferior a la información en bruto y sin tratamiento, contenida en uno o varios archivos, los originales no comprimidos.
¿Cómo se logra semejante hazaña? Existen diversos algoritmos [1] para reducir el peso de un fichero o ficheros no comprimidos. Todos ellos se basan en distintos métodos, que comparten entre ellos la sencilla idea de que mucha de la información contenida en un archivo es redundante [es decir, se repite] y que por tanto puede describirse de un modo más sencillo. Esto suele conducir a la siguiente pregunta: ¿es posible comprimir un fichero ya comprimido? La respuesta es que normalmente no [suele ser más habitual que el tamaño permanezca invariable o incluso aumente] aunque excepcionalmente puede darse esa circunstancia, sobre todo si se emplean algoritmos [programas] distintos en cada proceso sucesivo de compresión.
Un programa, o una subrutina, son implementaciones concretas de un algoritmo [o de varios distintos aplicados sucesivamente].
¿QUÉ TIPOS DE FICHEROS COMPRIMIDOS EXISTEN?
Bueno, para no aburrir a las vacas con sesudas exposiciones de epistemología aplicada, reduciremos la discusión a lo que más os interesa. Hay determinados ficheros que en su formato original ya están comprimidos, de modo que los programas que los utilizan los descomprimen [para leer sus datos] cuando los abrís, y al salvarlos vuelven a comprimirlos. Dentro de esta clase están los conocidos formatos jpeg, gif, mpeg y mp3, sobradamente conocidos por los internautas incluso noveles. Hay otro tipo de ficheros comprimidos que son el resultado de tratar otros ficheros con los programas adecuados, y que para ser utilizados deben ser vueltos a descomprimir.
¿Complicado? En absoluto. Cualquiera de vosotros puede bajarse [2] un fichero mp3 y escucharlo en su programa musical favorito [Winamp, Sonique,...] olvidándose por completo de si está comprimido o no. Un ejemplo del tipo de fichero no comprimido y de uso semejante sería el estándar wav, que normalmente está no comprimido. Otro caso parecido son los ficheros jpeg o los gif, usados normalmente para ilustrar las páginas web con gráficos y fotos. Estos ficheros están comprimidos, pero los programas de dibujo, los navegadores de Internet y otros programas de uso cotidiano los emplean sin necesidad de que ninguna herramienta de software "ad hoc" los descomprima previamente [ni ningún enanito en el interior de la CPU se dedique a ello]. Un fichero gráfico nada comprimido es el estándar BMP, famoso en Windows por ser el utilizado en los tapices, tapetes y fondos de vuestros preciosos escritorios virtuales.
El segundo tipo de ficheros, los que comprimen ficheros de todo tipo, necesita herramientas concretas para descomprimir la información, la cual en principio no es utilizable sin ser descomprimida. Os podéis imaginar que son sardinas en lata. ¿Os podéis comer las sardinas sin sacarlas de la lata? Pues lo mismo con los archivos contenidos en el interior de un fichero comprimido. Son conocidos por las extensiones [las tres letras detrás del punto en el nombre de los ficheros]: ARJ, ZIP, LZH, ARC, RAR, GZ... Nos concentraremos en los ficheros de tipo ZIP, que son los más empleados en Internet dado que son populares en todo tipo de plataformas, sistemas operativos y ordenadores, con excepción de las tostadoras Moulinex.
¿Por qué es preciso conocer qué ficheros ya están comprimidos y cuáles no? Para que no comprimáis ficheros ya comprimidos. No se puede ordeñar la misma vaca dos veces el mismo día.
Para ilustrar las diferencias entre ficheros comprimidos de uso directo, ficheros comprimibles no comprimidos, ficheros comprimidos de uso indirecto y fichas del parchís, utilizaremos un ejemplo práctico. Os doy un momento para que os toméis la aspirina y empezamos con el ejemplo.
[1] Un algoritmo es un modo estandarizado y estructurado de resolver un problema concreto, en un número finito de pasos preestablecidos, de modo que dados todos los datos del problema, se nos proporciona la solución.
[2] Bajar, descargar o "download". Acción por la cual un usuario de Internet copia en su ordenador conectado a la red uno o varios ficheros que están disponibles en un ordenador distinto e igualmente conectado a Internet. La acción contraria suele llamarse subir, cargar o "upload".
Tenemos este ejemplo con una serie de ficheros: tres corresponden a una bonita imagen de unos aliens zampabollos en tres formatos distintos [bmp, jpeg y gif]; otra serie de tres gráficos que presentan una bonita, romántica y aterciopelada puesta de sol en esos mismos formatos; otro bonito gráfico apto para hacer alfombras [de nuevo en los tres formatos] y finalmente un documento de Word realmente aburrido. DOS nos dice sobre ellos lo siguiente:
FICHER~1 DOC 166.912 26/01/00 20:15 Fichero de Texto Muy Aburrido.doc
PHOENIX BMP 308.278 24/09/00 12:22 Phoenix.bmp
PHOENIX JPG 96.359 24/09/00 12:23 Phoenix.jpg
PHOENIX GIF 81.998 24/09/00 12:22 Phoenix.gif
PUESTA~1 BMP 1.037.534 24/09/00 12:20 puesta2-tapiz.bmp
PUESTA~1 GIF 231.107 24/09/00 12:20 puesta2-tapiz.gif
PUESTA~1 JPG 12.854 24/09/00 12:20 puesta2-tapiz.jpg
ALIENS BMP 129.078 24/09/00 12:14 Aliens.bmp
ALIENS GIF 68.040 24/09/00 12:14 Aliens.gif
ALIENS JPG 11.813 24/09/00 12:14 Aliens.jpg
Nótese que en el caso de "Phoenix", un gráfico originariamente en 256 colores, la compresión GIF da mejores resultados que JPEG; en el caso de "Puesta", el fichero original era de colores a 32 bits y JPEG da mejor compresión... pero resulta que "Aliens" es de 256 colores y JPEG vuelve a comprimirlo más eficientemente... ¿por qué? No entraremos en ello, dado que no es el objeto de este recorrido. Experimentad, queridos míos, y llegad a vuestras propias conclusiones.
Vamos a realizar un fichero comprimido que contenga a estos archivos en formato ZIP, y otro en formato ARJ [muy popular hace unos años]. Luego haremos un fichero ARJ con el fichero ZIP resultante de nuestro primer experimento de compresión, y un ZIP con el ARJ que hicimos anteriormente... es decir, que "arjearemos" el zip y "enziparemos" el arj, si se me entiende mejor así. ¿Qué nos dice DOS?
EJEMPLO ZIP 1.469.997 24/09/00 12:45 ejemplo.zip
EZIP2ARJ ARJ 1.470.108 24/09/00 15:53 EZIP2ARJ.ARJ
EJEMPLO ARJ 1.460.337 24/09/00 15:51 EJEMPLO.ARJ
EARJ2ZIP ZIP 1.460.457 24/09/00 15:54 earj2zip.zip
Puede comprobarse que ARJ, en este ejemplo, comprime mejor que ZIP. También salta a la vista que "volver a comprimir" los ficheros previamente comprimidos no es una buena idea patentada, pues en ambos casos el tamaño aumenta respecto a su fichero origen.
¿PUEDES EXPLICAR QUÉ ES UN FICHERO ZIP?
Un archivo ZIP contiene, comprimidos, ficheros de cualquier tipo, incluso zip. Dichos ficheros pueden ser descomprimidos [con lo cual son sacados del archivo comprimido y creados en el directorio de destino que nosotros indiquemos], creados [se comprimen los ficheros originales, que opcionalmente son borrados, generándose el archivo ZIP], inspeccionados [para ver el contenido del fichero comprimido: así sabemos qué ficheros contiene, qué longitud tenían, cuánto espacio ahorramos al estar comprimidos... y otros tipos de datos], examinados [pueden ser leídos con visores, ya os explicaré más adelante cómo]
Para trabajar con ficheros zip [por cierto, viene del inglés "cremallera" no me preguntéis por qué] necesitáis un programa compresor y descompresor. Hay dos tipos de programas: los comerciales, que cuestan un dinerillo, entre los cuales destacan Turbo Zip y Winzip; y los "freeware" que os podéis bajar de Internet y usar por el morro, legalmente. El tutorial lo realizaremos con el programa Winzip porque es de fácil empleo para los novatos aunque tiene características "avanzadas" interesantes, pero naturalmente os indicaremos direcciones donde conseguir otros "compresores", tanto comerciales como no. Recordad que el registro [es decir, lo que hay que pagar por usar legalmente el programa] de Winzip 8 cuesta 29$ USA [muchos euros al cambio]