Van néhány olyan szempont, amely a számítógépeken tárolt és a hálózaton továbbított állományok formátumát befolyásolja. Mivel a hálózatokon nagyon sokféle géptípus és átviteli szabályrendszer (protocol) van, ezért meg kellett egyezni azon minimális kódkészletben, amely minden körülmények között átvihető. Az eredeti ("plain vanilla©) ASCII szabvány 32 és 127 közötti kódjait tartalmazó állományokkal általában nincs baj, bár még itt is előfordul, hogy egyes gépek egy-két karaktert másra cserélnek. Az egyik feladat tehát, hogy bizonyos esetekben (pl. ha egy programot elektronikus levélként akarunk továbbítani) a bináris állományt ilyen ASCII formátumra kell konvertálni. Erre a célra többféle kódoló és dekódoló program létezik, a legelterjedtebbeket érdemes megismerni és beszerezni.
A másik szempont az, hogy a gépidő, a tároló és a hálózati kapacitás jobb kihasználása érdekében az állományokat tömöríteni kell, s csak a felhasználás helyén és idején érdemes használható formába visszaalakítani őket. Különösen fontos a tömörítés nagyméretű szöveges file-oknál és a digitalizált kép- és hangállományoknál. Hasznos lehet továbbá olyan programoknál, amelyek nagyon sok kisebb file-ból állnak, mert ha egyetlen tömörített állományba csomagoljuk őket, akkor egyszerűbb a letöltésük és nem fordulhat elő, hogy egyes file-ok "lemaradnak©. Bizonyos segédprogramok csak ez utóbbi funkciót (tehát több file összecsomagolását) látják el, de nem tömörítenek: ezeket archiváló programoknak nevezzük.
Rengeteg tömörítő program, ill. szabvány alakult ki az elmúlt években, nagyrészt éppen a hálózatokon folyó file-transzfer megnövekedése következtében. Még most is sok új és egyre hatékonyabb program jelenik meg, ezért célszerű, ha kéznél van 8-10 féle tömörítő, ill. tömörített állományt megjelenítő program a legfrissebbek közül. Ezek természetesen a bináris/ASCII kódolókhoz hasonlóan letölthetők a hálózatról is, a különböző szoftver-archívumokból. Ugyancsak itt találhatunk olyan segédprogramokat, amelyek a nagyobb file-okat kisebb darabokra vágják, mert az e-mail levélben továbbított állományoknál egyes levelezőrendszerek nem hajlandóak 64 vagy 100 kilobájtnál többet átvinni.
A szöveges állományoknál még egy probléma fordul elő: a szöveg formáját, tördelését, betűtípusait is valahogyan tárolni, illetve továbbítani kell időnként. Ez az igény az utóbbi időben erősödött meg, a kiadványszerkesztő (DTP) programok terjedésével. Egyelőre itt is elég sok megoldás versenyez egymással, és előfordulhat, hogy egy letöltött szöveges állományt egyáltalán nem tudunk elolvasni és kinyomtatni megfelelő szoftver vagy hardver hiányában.
A file-transzfernél előforduló formátumok kezelésével kapcsolatban több segédlet, guide, FAQ található a hálózaton, és érdemes az egyes tömörítő/kódoló programok dokumentációját is elolvasni a speciális lehetőségek megismerése céljából. A továbbiakban a legelterjedtebb megoldások közül ismertetünk néhányat röviden.
A legtöbb tömörítő program kezelése hasonló egymáshoz. Ha például csak a program nevét írjuk be, akkor rendszerint kapunk egy listát a kiadható parancsokról és opciókról. Alapvető eltérés viszont, hogy egyes megoldásoknál ugyanaz a program végzi a be- és a kicsomagolást, másoknál viszont két külön program van. Ugyancsak egyedi jellemző, főleg a PC-s programoknál, az önkicsomagoló állományok létrehozásának képessége. Ezek olyan .EXE végű állományok, amelyeket egyszerűen csak el kell indítani és önmaguktól elvégzik a tömörített file-ok visszaalakítását (ezután az .EXE file törölhető).
Az IBM PC-t használók többnyire ismernek néhányat ezen programok közül, egy részük pedig más géptípusokon is megtalálható. Itt most csak a betömörített állományok visszaalakításához szükséges ismereteket közöljük.
A hálózaton talán a legelterjedtebb a PKWARE Inc. PKZIP rendszere, a tömörített állományoknak .ZIP a végződése. Itt a visszaalakításhoz külön program van, s a szintaxis a következő: "PKUNZIP file-név©. Fontos segédprogram a PKZIPFIX, amely lehetővé teszi az átvitel közben esetleg megsérült ZIP file helyreállítását a lehetőségek határain belül. Jó tudni, hogy a régebbi PKZIP verziók (pl. az 1.02-es) nem kompatibilisek az újakkal, és hogy illegális változatok (pl. a 2.01-es) is forgalomba kerültek.
Ugyancsak gyakoriak az .ARC végű tömörített file-ok egyes régebbi archívumokban. Ezek sem mindig kompatibilisek egymással, vagy az ARC, vagy a PKARC, vagy a PKPAK programokkal készültek. Legegyszerűbb, ha a NoGate Consulting PAK tömörítőjének egy újabb verzióját (pl. a 2.51-est) használjuk, ez ismeri valamennyi .ARC formátumot, sőt még a .ZIP file-okat és természetesen a saját .PAK állományait is kezeli. A visszaalakítási parancs a következő: "PAK e file-név©.
Egyes gépeken (főleg a USENET newsgroup archívumokban) Rahul Dhesi tömörítő programjával készített, .ZOO végű állományokat találunk. Ezek kicsomagolásához vagy az eredeti ZOO programot kell használnunk ("ZOO -e file-név©), vagy elég beszereznünk a LOOZ nevű kis programot, amely csak visszaalakítani tud ("LOOZ file-név©). Előfordulhat, hogy .LZH végű állományokat találunk, ehhez Haruyasu Yoshizaki LHA nevű programjára van szükség, a visszaalakító parancs: "LHA e file-név". Mostanában egyre több helyen (elsősorban BBS archívumokban) használják az ARJ tömörítőt, amely jelenleg a legjobbnak számít, minden PC használónak érdemes legalább a 2.30-as verziót beszerezni. Az .ARJ végződésű állományok az "ARJ x file-név" paranccsal alakíthatók vissza.
A tömörített grafikus állományoknak annyiféle szabványuk van, hogy itt csak a Compuserve hálózat GIF formátumát említjük meg. Ez az egyik legjobban elterjedt típus, sok program tudja kezelni. Ajánlható például a PICEM program, amely bármilyen monitoron meg tudja jeleníteni a .GIF végű állományokat (és még emellett a szintén gyakori .PCX és .PIC képeket is). Jó GIF-nézegető a VGIF program is, amely maximálisan kihasználja a VGA monitorok lehetőségeit. A többi grafikus formátumhoz valamelyik általános képkezelő és konvertáló közprogramot érdemes használni (pl. az Image Alchemy-t, ami a ismeri a JPEG nevű, jelenlegi leghatékonyabb képtömörítési szabványt is).
A hálózaton elérhető gépek jelentős része UNIX vagy UNIX-szerű operációs rendszert használ. Ezeknek a gépeknek az archívumaiban gyakran találunk a UNIX tömörítő vagy archiváló programjaival "kezelt" állományokat. Szerencsére ezeknek a UNIX programoknak megvan a PC-s változatuk is, így az ilyen file-okat a DOS-t használók is vissza tudják alakítani.
A leggyakoribb a COMPRESS program használata, amely a Lempel-Ziv kódolásra épül, és a tömörített állományok .Z vagy .XZ végződést kapnak. A visszalakításhoz egy UNCOMPRESS, vagy ZCAT, vagy DECOMP programra van szükség, de a UNIX-os COMPRESS programmal is lehet kicsomagolni, a -d opciót használva. A PC-s DECOMP-nál például a visszaalakító parancs: "DECOMP in-file.Z out-file". Egyes archívumoknál lehetőség van rá, hogy ha akarjuk, letöltés előtt saját magunk tömörítsük a nagyobb szöveges állományokat a COMPRESS-szel. Ezt a lehetőséget ajánlatos is kihasználni, mert 50-60%-os megtakarítást tudunk elérni vele az átviteli időnél és költségeknél.
A GNU-nál (a UNIX public-domain változata) a GZIP program terjedt el. Ez lefelé kompatibilis a COMPRESS tömörítővel (vagyis ki tudja csomagolni a .Z végű állományokat), de jobban tömörít és több opciója van, bár valamivel lassabb. A tömörített file .gz végződést kap, s a visszaalakítás itt is a -d opcióval történik.
Egy másik gyakori UNIX segédprogram a TAR (Tape ARchive), amely nem tömörít, csak kisebb állományokat összecsomagol egyetlen file-ba, ami azután már egyszerűbben kezelhető, továbbítható. Az archivált állomány .tar végződésű, és a visszaalakításához a "tar x file-név" parancsot kell kiadni. Ez létrehozza és kicsomagolja az esetleges aldirectory-kat is. PC-re több TAR változat is létezik (ExTAR, LTAR stb.), ezek megtalálhatók a hálózati archívumokban. A .tar file-ok bináris állományok, ezt letöltésüknél figyelembe kell venni. Hasonló, de ritkábban használt archiváló program a SHAR (SHell ARchive), amely .shar végű ASCII állományokat hoz létre, a kicsomagolásukhoz a UNIX-os UNSHAR programra van szükség. PC DOS-nál például a TOADSHR vagy a SHAREXE program használható.
Akik Macintosh gépekre írt állományokat szeretnének letölteni a hálózatról, azok gyakran bináris, .SIT végű file-okat találnak, amelyek a STUFFIT programmal készültek. Ezenkívül még a BINHEX kódolás fordul elő gyakrabban. Az ASCII típusú .HQX állományokat például a BinHex 4.0 shareware programmal lehet visszaalakítani. Ezeknek a programoknak is megvan a DOS, UNIX és esetleg VM operációs rendszerre készült public domain változatuk.
A konvertált file nevének kiterjesztése |
Operációs rendszer |
A visszaalakításhoz szükséges program |
---|---|---|
.arc | (MAC) (MS-DOS) (UNIX) |
arcmac.hqx pk361.exe arc602.exe arc.tar.Z |
.arj | (MAC) (MS-DOS) (UNIX) |
unarjmac.cpt.hqx arj230.exe unarj230.tar.Z |
.boo | (MS-DOS) | fdeb280.boo |
.cpt | (MAC) (UNIX) |
compact-pro-133.hqx macutil-20b1.shar |
.dwc | (MS-DOS) | dwc-a501.exe |
.gz | (UNIX) | gzip-1.2.2.tar |
.hqx | (MAC) (UNIX) |
binhex4.0.bin mcvert-165.shar |
.lbr | (MS-DOS) | lue220.arc |
.lha/.lzh | (MAC) (MS-DOS) (UNIX) |
maclha2.0.cpt.hqx lha213.exe lharcsrc.zoo (.lzh) lha-1.00.tar.Z (.lha) |
.pak | (MS-DOS) | pak251.exe |
.pit | (MAC) (UNIX) |
stuffit-151.hqx mcvert-165.shar |
.shar | (MS-DOS) |
toadshar1.arc sharexe.arc |
.sit | (MAC) (UNIX) |
stuffit-expander -305.sit.hqx |
.tar | (MS-DOS) | extar10.zip |
.uu | (MS-DOS) | uuexe510.zip |
.zip | (MAC) (MS-DOS) (WINDOWS) (UNIX) |
mac-zip-10.hqx unzip-20.hqx pkz204g.exe wunz13.zip winzip41.zip zip19pl.zip |
.zoo | (MAC) (MS-DOS) (UNIX) |
maczoo.sit.hqx zoo210.exe zoo210.tar.Z |
.Z | (MAC) (MS-DOS) |
maccompress-32.hqx comp430d.zip decomp2.zip |
A bináris állományokat (programok, képek, tömörített file-ok stb.) ASCII formájúvá konvertáló szoftverekből kevesebb fajta terjedt el szerencsére, mint az archiváló és tömörítő programokból. A leggyakoribbak a következők:
A UNIX gépeken általános az UUENCODE alkalmazása. Sokszor a távoli felhasználónak is lehetősége van ezen konvertáló program használatára, így a szövegessé alakított bináris file-okat feladhatjuk magunknak levélben, vagy egyszerűen kiírathatjuk a képernyőre és egy log file-ba menthetjük. A binárisról ASCII formátumra konvertáló parancs formája: "uuencode in-file file-név >out-file", ahol az in-file az eredeti bináris állomány, a file-név egy név, ami bekerül az ASCII állományba, az out-file pedig az átalakított ASCII file. Ha ez utóbbit elhagyjuk, akkor a konvertált adatok közvetlenül a képernyőre íródnak ki. A file-név általában megegyezik az in-file nevével, az out-file szabályos végződése pedig az .uu vagy .uue betűcsoport.
A visszaalakítás egyszerűen az "uudecode out-file" paranccsal történik és ilyenkor létrejön egy file-név nevű állomány. Az UUENCODE kódolás nyilvános, és rendelkezésre áll PC-re és más gépekre is (pl. az ENCODE/DECODE vagy a TOADUU programok), szükség esetén pedig forrásnyelvű változat is található a public domain területen. Sajnos az UUENCODE szabványnak több változata terjedt el, amelyek kis mértékben különböznek egymástól, így érdemes egy olyan programot beszerezni, amely ismeri ezeket.
Az ASCII változat természetesen nagyobb, mint az eredeti bináris, kb. 30 százalékkal. A kódolt szöveg a "begin" szóval kezdődik és a végét egy "end"-et tartalmazó sor jelzi. Ha levélben kapunk egy vagy több ilyen állományt, akkor egy szövegszerkesztővel törölhetjük a "begin" előtti felesleges sorokat (pl. az e-mail címzési adatokat), bár a legtöbb dekódoló programot ezek nem zavarják. Több kódolt állományt tartalmazó file esetén a szövegszerkesztővel külön file-ba kell menteni minden egyes "begin" és "end" közötti blokkot, és csak ezután visszaalakítani őket. Időnként előfordulhat olyan probléma is, hogy egyes programok a fordított aposztróf (`) karaktert szóközre cserélik a kódolt állományban. Ilyenkor valamilyen segédprogrammal (pl. egy szövegszerkesztővel) nekünk kell visszacserélni ezt a jelet.
Ezt a bináris/ASCII kódolást valószínűleg egyedül a HENSA/micros archívumban használják "hivatalosan", ott viszont minden PC-s szoftver a MAKEBOO programmal van kódolva. A .BOO végű állományokat a DEBOO vagy az FDEB (Fast Deboo) programokkal lehet visszaalakítani, a parancs formája: "DEBOO file-név". A probléma ott van, hogy ezek a visszaalakító programok is BOO formátumban vannak tárolva az HENSA archívumban. Ebből a csapdából úgy lehet kijutni, hogy letöltjük a /micros/ibmpc/dos/tools directory-ból az ott található forrásnyelvű BASIC programot, amely MS-BASIC-ben elindítva képes a DEBOO.BOO állományból szép lassan előállítani a már futtatható DEBOO.EXE programot. Még a DEBOO.EXE is elég lassú és keményen igénybe veszi a winchestert, ezért aki gyakran használja ezt az archívumot, annak érdemes az FDEB programot letölteni.
Előfordul még a BTOA kódolás is, ennek a visszaalakításához az ATOB nevű programra van szükség, ez is megtalálható a hálózaton a legtöbb géptípushoz. A BTOA konverzió az FTPMAIL szolgáltatás alapértelmezett kódolási formája. A további hasonló programok (ABE, BIN2ASC, CONVERT stb.) nem terjedtek igazán el. A Macintosh gépekre a HQX (BINHEX) konvertálás a leggyakoribb, a Gopher rendszereknél például külön állománytípust hoztak létre hozzá.
Bár a szabványos ASCII karaktereket tartalmazó (rendszerint .TXT végű) file-okkal nincs sok gond a file-transzfer szempontjából, mégis a szövegek megjelenési formájának, tipográfiai jellemzőinek megadásához szükségessé váltak bizonyos különleges technikai megoldások. Ezek részben egyes hálózati szolgáltatásokhoz kötődnek, másrészt az elterjedt szöveg- és kiadványszerkesztő programok "kvázi" szabványai.
Amikor az EARN/BITNET hálózaton a GET paranccsal lekérünk egy állományt, akkor többféle formátum közül választhatunk. A leggyakoribb a PUNCH formátum, ennek részletes leírása a GET LISTPUN MEMO paranccsal tölthető le a legközelebbi listserverről. A PUNCH formátumot azért tervezték, hogy csak e-mail forgalmat bonyolító gateway gépeken is lehessen 80 karakternél szélesebb sorokat tartalmazó szöveges állományokat (táblázatok, félgrafikus rajzok) továbbítani. Az LPUNCH konvertáló program max. 80 karakteres sorokra tördeli az eredeti állományt, és a file, valamint a sorok elejére ír némi kódinformációt. Az állomány ettől még eléggé olvasható marad, de az eredeti formátum visszaállításához szükség van az LPUNCH programra. Ez letölthető a hálózati archívumokból, de a LISTPUN MEMO állományban is van egy PASCAL és egy C nyelvű PUNCH program.
Érdemes még megemlíteni a NETDATA formátumot. Ennél a sorok maximálisan 255 karakteresek lehetnek és mások a fejléc információk. A PUNCH és a NETDATA formátumokat a különböző szerver programok az egymás közötti kommunikációra is használják, ill. a szervereken tárolt adatbázisokban való keresés eredményét is e formában küldik el a felhasználóknak.
Egyre több szöveg (dokumentáció, kézikönyv, elektronikus újság stb.) jelenik meg a hálózaton valamelyik népszerű szövegszerkesztő vagy desktop publishing szoftver output formátumában. Jó esetben egyszerre több « köztük az egyszerű ASCII « formátum közül választhatunk, de előfordulhat, hogy csak egyféle változat van. Ilyenkor a szöveg kinyomtatásához vagy szükség van arra a szoftverre és hardverre, amelyhez az készült, vagy megpróbálhatunk valamilyen konvertáló vagy interpretáló programot keresni a public domain szoftverek között.
Sok szerkesztőprogram készít PostScript nyelvű állományokat. Ezek .PS vagy .EPS végződésükről ismerhetők fel és speciális Postscript nyomtatót vagy valamilyen értelmező programot (pl. GhostScript) igényelnek. Hasonló jellegű file-okat készít a TeX nevű szedőprogram, ezek általában .TEX vagy .DVI (DeVice Independent) végződésűek. Maga a TeX rendszer is letölthető a hálózatról, de több kisebb konvertáló és megjelenítő program is rendelkezésre áll. Bár mindkét rendszer szöveges parancsokat illeszt a dokumentumokba, az esetleges speciális karakterek miatt jobb, ha bináris file-ként kezeljük és töltjük le őket.
Rohamosan terjed a WinWord rendszer használata. A Word vagy WinWord file-ok általában .DOC végződést kapnak. Előfordul még a WordPerfect szövegszerkesztő formátuma is, ezek az állományok .WP vagy .WP5 végződést viselnek. Pontos megjelenítésükhöz szükség van a WordPerfect 5.0-ás vagy újabb verziójára. Ha nem fontos a szöveg formátuma, csak a tartalma, akkor egy újabb Norton Commander is megteszi, mely egyéb szövegszerkesztők mellett a Word-ben és WordPerfect-ben írt állományokat is meg tudja mutatni.
A legújabb nyelv a szövegformátum és a belső szerkezet jelölésére az SGML (Standard Generalized Markup Language), amelynek alkalmazása az elektronikus könyvek és a hipertext anyagok számának növekedésével egyre gyakoribb lesz. Ennek kezelésére még csak drága, profi szoftverek képesek. További hipertext formátumokkal is találkozhatunk egyes speciális archívumokban: például a Windows Help és Toolbook, vagy a Macintosh Hypercard állományai. Eredetileg levelezéshez találták ki a MIME formátumot, de ma már máshol is használják szöveges állományban elhelyezett multimédia anyagok terjesztésére. Pontos megjelenítéséhez MIME vagy Metamail levelezőprogram kell.