Všetko o súboroch ZIP, kompresii, šifrovaní a alternatívach

zverejnenie: Vaša podpora pomáha udržiavať web v prevádzke! Za niektoré zo služieb, ktoré odporúčame na tejto stránke, získavame poplatok za sprostredkovanie.


úvod

Veľkosť súboru je drahá. Zabúdame na to niekedy preto, že kupujeme osobné počítače s 5 až 10-krát toľkým miestom na disku, aké budeme kedy potrebovať. Pre väčšinu jednotlivých používateľov nie je miesto na disku drahé.

Ale pre online podniky a spoločnosti orientované na web sa veľkosť súboru môže stať veľkým problémom. Ak hostíte tisíce (alebo milióny) súborov, náklady na ukladanie údajov sa stanú vážnymi problémami. A ak poskytnete tieto súbory tisícom (alebo miliónom) koncových používateľov, náklady na šírku pásma sú tiež veľkým problémom.

Všetko o súboroch ZIP

Veľkou výhodou môže byť zníženie veľkosti každého z týchto súborov o 30% alebo 40%. Navyše, pri prenose súborov (napríklad keď si používateľ niečo stiahne), každý prenos má malú dodatočnú šírku pásma a náklady na výpočty – je lacnejšie preniesť na 100 MB súbor ako preniesť desať 10 MB súborov.

Z tohto dôvodu by nemalo byť prekvapujúce, že toľko stiahnuteľných súborov dostupných online používa formát ZIP alebo iný kompresný formát. Je dôležité vedieť niečo o súboroch ZIP (a iných), o tom, ako fungujú a čo musíte použiť.

Niekoľko populárnych systémov na správu obsahu (najmä WordPress) používa súbory ZIP na odovzdávanie tém a doplnkov, ako aj na archívy záloh systému, takže ktokoľvek, kto používa webovú stránku WordPress (alebo iný CMS), má ďalšiu motiváciu porozumieť tejto téme..

Čo robí ZIP?

ZIP (alebo .zip) je archívny formát súboru. Mnoho súborov, vrátane priečinkov a podpriečinkov, je možné „zazipovať“ do jedného súboru ZIP. Súbor ZIP je omnoho menší ako pôvodné súbory a archív je možné preniesť ako jednu jednotku (namiesto niekoľkých samostatných súborov).

Vo všeobecnosti nie je možné súbory ZIP používať ani prezerať. Ak napríklad vytvoríte ZIP obrázok alebo film, obrázok alebo videozáznam sa neuvidí, kým súbor „neodzipujete“. Z tohto dôvodu sa dnes ZIP väčšinou používa ako formát na prenos súborov. Používa sa tiež na zálohovanie systému súborov.

Alternatívy k ZIP

Existuje niekoľko rôznych formátov súborov a pomocných programov, ktoré vykonávajú takmer presne tie isté veci ako ZIP: tar, 7zip, rar.

Zatiaľ čo niektoré základné matematiky a teórie sa líšia, z pohľadu užívateľa sú z veľkej časti vzájomne zameniteľné. V tomto článku sa budeme väčšinou baviť iba o súboroch ZIP, ale na tieto ostatné formáty sa všetko vzťahuje takmer rovnako. Jedna vec, ktorá je iná, je to, aké nástroje budete potrebovať na rozbalenie alebo rozbalenie súborov na použitie. Záver článku obsahuje informácie o týchto rôznych nástrojoch pre najpopulárnejšie formáty spolu so ZIP.

Bezstratová kompresia

Najdôležitejšie na ZIP je, že zmenšuje súbory. Aby ste pochopili, ako to ZIP robí, musíte pochopiť, ako funguje kompresia údajov.

Existujú dva druhy kompresie – stratová kompresia a bezstratová kompresia. Stratová kompresia je najjednoduchšie pochopiteľná; údaje sa zmenšia odstránením niektorých detailov alebo vernosti. Deje sa to pomerne často s hudbou a obrázkami – iba odstránime trochu detailov, vzorka je len trošku, znížte rozlíšenie. Funguje to preto, že ľudia môžu toľko vnímať; môžete si obrázok zobrať úplne bez toho, aby si to niekto všimol.

Stratová kompresia však v niektorých prípadoch nefunguje. Nemôžete niekomu poslať softvérovú aplikáciu s odstránenou funkciou alebo archív súborov s chýbajúcimi súbormi.

Bezstratová kompresia znamená zmenšenie údajov takým spôsobom, aby sa originál mohol úplne zrekonštruovať – ​​nestratia sa žiadne informácie.

(Zjednodušený) príklad bezstratovej kompresie

Ak si chcete predstaviť, ako by sa to mohlo stať, predstavte si zoznam pixelov pre obrázok. Každý pixel predstavuje určitú farbu predstavovanú šiestimi číslicami (napríklad 3D590D). pole tisícov týchto pixelov kóduje informácie potrebné pre obrázok. Obrázok, ktorý by sme spadli do stredu tohto zoznamu pixelových farieb a videli sme toto:

3F39A1 | 3F39A1 | 3F39A1 | 3F39A1 | 3F39A2 | 3F39BB

Aká je pravdepodobnosť? Niekoľko pixelov vedľa seba rovnakej farby, za ktorými nasleduje pár, ktoré sú len trochu odlišné? Pravdepodobne.

Mohli by sme označiť konkrétny symbol (napríklad%), ktorý znamená „opakovať“, a skomprimovať tento reťazec pixelov do:

3F39A1 | % | % | % | 3F39A2 | 3F39BB

Ďalej by sme mohli definovať prírastkový symbol, ktorý nám umožní určiť jednu farbu na základe predchádzajúcej farby. Rozdiel medzi 3F39A1 a 3F39A2 je iba jeden a rozdiel od poslednej hodnoty je 19:

3F39A1 | % | % | % | + | 19

Nakoniec sme mohli odstrániť medzerník a nechať nás s:

3F39A1 %%% ++ 19

Takže teraz sme komprimovali tento zoznam pixelov z 51 znakov na 13 – takmer 75% zníženie.

Bezstratová kompresia v reálnom živote

V skutočnosti je bezstratová kompresia oveľa zložitejšia a používa viac techník. Funguje to na podkladových údajoch, nie na farebnej reprezentácii vo formáte súboru. Koncept je však rovnaký: použite vzory v údajoch (opakovanie, postupné sekvenovanie) na nájdenie spôsobov, ako uchovávať informácie a zároveň znížiť počet bitov potrebných na ich uloženie..

Pokyny na zipsovanie a rozbalenie údajov sú zabudované do rôznych softvérových nástrojov na zipsovanie.

šifrovanie

Ďalšou vecou, ​​ktorú môže ZIP (a iné archivátory) urobiť, je šifrovanie. V takom prípade je súbor chránený heslom, aby ho mohol rozbaliť iba niekto s týmto heslom.

Je dôležité si uvedomiť túto ochranu heslom pre šifrované súbory nie je otázka povolenia. Heslo sa nikde neukladá, nedá sa obnoviť a vy nemôžete obísť šifrovanie ani zmeniť svoje heslo..

Je to preto, že pri šifrovaní súborov sa heslo v šifrovacom algoritme skutočne používa.

Príklad (zjednodušeného) šifrovania hesla

Zoberme si náš komprimovaný reťazec z posledného príkladu:

3F39A1 %%% ++ 19

Teraz potrebujeme heslo – povedzme 12345. Na zašifrovanie reťazca by sme mohli použiť samotné heslo.

Najprv musíme previesť všetky nealfanumerické číslice na čísla. Znak percenta je 25 v ASCII a znamienko plus je 2B.

(Upozorňujeme, že toto nie je spôsob, ako toto kódovanie funguje v reálnom živote – je to iba koncepčný príklad.)

3F39A12525252B2B19

Teraz zmeníme každú číslicu na základe hesla. Za týmto účelom pridáme číslice z hesla do číslic reťazca. Číslice idú od 0 do 9, potom A-F. Keď sa dostanú k F, omotajú sa okolo 0.

3F39A12525252B2B19
+12345123451234512345
———————-
416DF2486A37507C3C45

Konečný reťazec 416DF2486A37507C3C45 nie je možné rekonštruovať bez znalosti pôvodného hesla. Takto funguje šifrovanie pomocou hesla.

Šifrovanie v reálnom živote

V skutočnosti je to oveľa komplikovanejšie. Šifrovacie algoritmy pracujú na podkladových dátach (bitoch a bajtoch), nie na ich numerických reprezentáciách a používajú heslo zložitejšie ako bitové sčítanie..

Ale nič z toho nemusíte vedieť. Dôležité je pochopiť, že heslo sa skutočne používa v samotnom šifrovaní, nie ako prostriedok osobnej identifikácie, napríklad prihlásenie sa na webovú stránku..

Ako používať súbory ZIP

Väčšina počítačových systémov – či už Windows, Mac alebo Linux – má vstavanú podporu pre kompresiu a nekomprimovanie súborov ZIP.

Zipsové súbory

windows

V programe Prieskumník môžete otvoriť kontextové menu (kliknúť pravým tlačidlom myši) a vedľa položky „Nový priečinok“ bude položkou niečo ako „Nový komprimovaný priečinok“ alebo „Nový archív ZIP“. (Znenie sa bude líšiť v závislosti od konkrétneho OS a verzie.)

Týmto sa vytvorí archívny priečinok a môžete nastaviť jeho názov. Jednoducho doň pretiahnite položky a budú pridané do archívu.

gumák

V prípade počítačov Mac jednoducho stačí kliknúť dvoma prstami na súbor alebo priečinok a otvoriť kontextovú ponuku a stlačiť ju. Po komprimácii do nej nemôžete presunúť nové položky. Ak teda chcete skomprimovať archív, musíte sa uistiť, že všetky súbory, ktoré v ňom chcete, sú v priečinku, potom priečinok skomprimujte..

Rozbaľovacie súbory

Pre väčšinu súborov ZIP vo väčšine systémov jednoducho kliknutie (alebo dvojité kliknutie), ako by ste súbor otvorili, ho buď úplne rozbalí, alebo otvorí okno do archívu, takže z neho môžete vytiahnuť jednotlivé položky..

Iné formáty a pomôcky

Ak chcete použiť jeden z alternatívnych formátov kompresie, napríklad .tar, .7z, .gz alebo .rar, budete si musieť stiahnuť a nainštalovať ďalší nástroj..

Najpopulárnejším nástrojom na kompresiu a dekompresiu súborov v systéme Windows je:

  • 7-Zip – Tento nástroj obsahuje vlastný formát kompresného súboru (7ZIP alebo .7z), ale tiež nekomprimuje niekoľko ďalších populárnych formátov..

V prípade počítačov Mac možno budete potrebovať dve rôzne aplikácie na otváranie rôznych formátov:

  • Unarchiver – Toto zvládne takmer každý formát archívneho súboru, ale má problém s niektorými .rar súbormi. (Formát .rar je trochu divný a má veľa variácií.)
  • Unrarx – Jedná sa o aplikáciu bez kosti s veľmi neatraktívnym používateľským rozhraním. Ale je to užitočné pri riešení niektorých problémov s neobvyklými príponami .rar.

Zaoberanie sa viacdielnymi archívmi

Jednou z výhod archívnych formátov je, že jeden archívny súbor môže byť rozdelený do niekoľkých samostatných častí a potom znovu zložený. Toto sa používalo často počas dní na disketách, keď jeden disk nebol dostatočne veľký na to, aby pojal celý súbor..

Dnes je najbežnejším dôvodom viacdielnych archívnych súborov pravdepodobne zdieľanie súborov veľmi veľkých videí a filmov. Ak stiahnutie celého filmu trvá hodinu, je lepšie, ak je rozdelený na menšie súbory, takže ak dôjde k zlyhaniu alebo poškodeniu súboru, nemusí sa sťahovanie znova začať znova..

windows

Najjednoduchším nástrojom na vytváranie a extrahovanie viacerých súborov Zip (a iných typov archívov) je bezplatný 7-Zip.

Pri vytváraní archívov stačí otvoriť pomôcku a postupujte podľa pokynov – nie je to nijako ťažké.

Ak chcete extrahovať viacdielny archív, musíte sa uistiť, že všetky súbory majú rovnaký základný názov a či sú správne pripojené k číslu dielu, napríklad:

  • file_name.part01.zip
  • file_name.part02.zip
  • file_name.part03.zip

Tieto súbory musia byť všetky spolu v jednom priečinku. Prvý otvoríte iba ako bežný archív a systém nájde ostatné súbory. Ak sú však niektoré z nich nesprávne pomenované, budete mať problém.

gumák

Extrahovanie viacdielnych súborov v systéme Mac je úplne rovnaké ako v systéme Windows, s výnimkou použitia nástroja Unarchiver alebo iného nástroja. Obava z názvov súborov je veľmi dôležitá.

Pri vytváraní súborov pozostávajúcich z viacerých častí je najjednoduchšie použiť terminál (príkazový riadok). Jednoducho cd do adresára, ktorý obsahuje súbory, ktoré chcete komprimovať a:

zip -r -s MaximumSize ArchiveName.zip Názov priečinka /

  • MaximumSize je najväčšia veľkosť súboru, ktorú chcete na výstupe
    • 100 000 kB = 100 MB
    • 1g = 1 GB
    • 1t = 1 TB
  • ArchiveName.zip je nový názov výstupného súboru
  • FolderName je názov existujúceho priečinka, ktorý obsahuje to, čo chcete archivovať

(Môžete tiež použiť príkazový riadok na splnenie všetkých ostatných požiadaviek na kompresiu a dekompresiu. A ak pracujete s príkazovým riadkom a archivujete súbory, môžete vyskúšať túto funkciu Bash, ktorá slúži ako univerzálny nástroj na extrahovanie..

Pozor na archívy

Ak pravidelne pracujete so ZIP a inými archívmi, je to pravdepodobne preto, že sťahujete veľa súborov z internetu. Ak tieto súbory získavate zo systému BitTorrent alebo iného systému zdieľania súborov, musíte si dať pozor na svoje archívne súbory, ktoré sťahujete.

Súbory ZIP a iné typy archívov môžu obsahovať vírusy a iný škodlivý softvér. Ak otvoríte archív a nájdete iný formát súboru, než aký očakávate, najmä spustiteľný formát ako .exe, neotvárajte ho..

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map