Els arxivadors són programes que poden comprimir informació en fitxers. Els arxivadors moderns us permeten combinar diversos fitxers en un sol arxiu i visualitzar-ne el contingut. La mida de l'arxiu creat amb la seva ajuda resulta ser molt menor que la mida del fitxer original.
Instruccions
Pas 1
El principi general de funcionament de la majoria dels arxivers es basa en un algorisme desenvolupat pels investigadors A. Lampel i J. Ziv als anys 80 del segle passat. L’algoritme creat per Ziv i Lampel permet calcular el codi duplicat en un fitxer i així reduir-ne la mida. Per a això, es compila un diccionari a partir de seqüències de dades. Per exemple, el codi binari del fitxer conté la combinació següent: 10111011101110110011. És fàcil veure que el codi 1011 es repeteix diverses vegades. L’arxivador detecta aquest codi i l’escriu a l’arxiu només una vegada i, en descomprimir-lo, torna a substituir el codi als llocs necessaris del fitxer.
Pas 2
El grau de compressió del fitxer depèn de la mida del diccionari d'origen. Si el diccionari és massa gran, afectarà la mida de l'arxiu. Si la mida del diccionari és massa petita, es poden produir errors a l'arxiu creat. Podeu augmentar la relació de compressió d’un fitxer mitjançant la codificació d’entropia (l’anomenat mètode Huffman). Amb la codificació d'entropia, els fragments binaris que es repeteixen s'escriuen mitjançant un codi curt. En els arxius moderns, la codificació d’entropia s’utilitza com a mètode de codificació addicional.
Pas 3
Als sistemes Unix, gzip és l'arxivador més popular. Aquest arxiu comprimeix les dades sense pèrdues i es basa en l'algorisme Deflate. La compressió de fitxers aquí es produeix en dos enfocaments: en primer lloc, es substitueixen els fragments de codi duplicats i, a continuació, els caràcters que contenen són substituïts per caràcters nous mitjançant el mètode Huffman. Els arxivadors per als sistemes Unix tenen una sèrie de desavantatges. Estan principalment dirigits a arxius que consisteixen en molts fitxers, de manera que és difícil descomprimir un sol fitxer. Això es deu al fet que els arxivadors Unix veuen un arxiu com una matriu contínua de tots els fitxers que hi contenen. L’arxiu es forma a partir de la informació continguda en cada fitxer.
Pas 4
Als sistemes Windows, són habituals fitxers com WinZip, 7-zip i WinRAR. A diferència dels sistemes Unix, aquests arxivadors estan enfocats a treballar tant amb fitxers individuals com amb arxius continus que consisteixen en molts fitxers. La majoria dels arxivadors de Windows moderns "entenen" molts formats d'arxiu, admeten el xifratge i són capaços de comprimir fitxers molt grans (per exemple, la mida màxima de l'arxiu WinRAR és de més de vuit mil milions de gigabytes).