Magyar ékezetes karakterek az elektronikus levelezésben

Pásztor Miklós

E-mail: pasztor@sztaki.hu

Synopsis

Már MA van mód arra, hogy különbözõ operációs rendszerekben dolgozó emberek, INGYEN rendelkezésre álló eszközök használatával magyar ékezetes leveleket váltsanak egymással !

Kérem, ha bárkinek megjegyzése, kiegészítése van, - ha hibát talál akkor feltétlenül - írjon a fenti címre. Elõre is köszönöm.

1.Bevezetés

A számítógépek az egyes betûket, írásjeleket binárisan kódolják. Rendszerint egy nyolcbites byte felel meg egy-egy írásjelnek. Sajnálatos módon nemcsak az egyes gyártók, hanem a szabványosítási szervezetek is többféle kódolást vezettek be. Számítanunk kell rá, hogy nem minden levelezõpartnerünkkel sikerül ékezetesen leveleznünk: lehet, hogy az üzenetben furcsán jelennek meg, vagy kimaradnak egyes részek, esetleg a terminálunk vagy levelezõprogramunk megbolondul egy levél olvasásakor. Van azonban szabványokon alapuló, egyre terjedõ megoldás. Ez az írás azért készült, hogy segítsen az ilyen megoldások elterjesztésében, bevezetésében.

1.1. Karakterkód-készletek

Az angol ABC betûinek szokásos kódolása a hét bites ASCII kódolás. Nyolcbites változatban rendszerint úgy használatos, hogy a nyolcadik bit helyére nulla kerül. Ezt a kódolást a legtöbb számítógépes rendszer támogatja. Az ékezetes karakterek és speciális jelek azután olyan bitkombinációk lesznek, amelyekben a nyolcadik bit egyes. A legelterjedtebb ISO 8859 szabvány olyan karakterkészleteket tartalmaz, amelyekben a táblázat alsó fele, (vagyis a nyolcadik bitben nullát tartalmazó bitkombinációk) mind megegyeznek egymással, és a hétbites ASCII kódolással. A táblázat felsõ, nyolcadik bitében egyest tartalmazó részében különbözõ karakterkészleteket tartalmaznak, így különbözõ kultúrkörök igényét elégítik ki.

Az ISO 8859 által támogatott nyelvek, illetve ABC-k:

8859-1 Nyugateurópai, latin-amerikai nyelvek, szuahéli

8859-2 Keleteurópai nyelvek

8859-3 Délkeleteurópai nyelvek

8859-4 Skandináv nyelvek

8859-5 Cirill

8859-6 Arab

8859-7 Görög

8859-8 Héber

Az összes ékezetes magyar karaktert a 8859-2 kódkészlet tartalmazza, de legtöbbször a 8859-1 is megfelelõ lehet (ld. 1.3).

1.2. MIME, az ékezetes karakterek átvitelének megoldása az Internet levelezésben

A nagy számítógéphálózatok kialakulásakor a levelezés angol nyelven folyt. Az angol ABC karakterkészlete a 7 bites ASCII, nem tartalmaz ékezetes betûket. Az ékezetes betûket olyan 8 bites kombinációval szokás jelölni, ahol a 8. bit egyes. A 7 bites kódkészlet 8 bites változata egyszerûen úgy áll elõ, hogy a 8. bit 0-t, esetleg ellenõrzõ bitet tartalmaz. A levelek átvitelének Internet szabványa az RFC821 (SMTP) csak 7 bit átvitelét írja elõ. Mint látható ez elegendõ angol nyelvû szöveges információk átvitelére, de nem felel meg sem ékezetes - pl. magyar nyelvû - szövegeknél, sem bináris információknál, például programoknál, kódolt, formázott szövegeknél, táblázatoknál stb. Vannak ugyan olyan implementációk amik mind a 8 bitet átviszik, és az újabb szabvány, az ESMTP 8 bit átvitelét írja elõ, de általában csak 7 bit vagyis az ékezetek nélküli ABC átvitelét várhatjuk el az Internet levelezésben.

Az Internet irányító testületei felismerték, hogy mennyi problémát okoz az, hogy nem lehet egyszerû, szabványos módon levélként átvinni ASCII szövegtõl különbözõ információt. Ezért 1992-ben az IETF (Internet Engineering Task Force) egyik munkacsoportja megalkotta a MIME, (Multipurpose Internet Mail Extensions azaz Többcélú Internet Levelezési Kiegészítések) ajánlást. Ezzel megoldást adnak nem csak magyar vagy más ékezetes karakteres információk hanem pl. programok, kép, mozgókép, hang átvitelére is. Az RFC822/RFC821 keretein belül maradva, új borítékelemek és kódolási eljárás bevezetésével lehetõvé válik több részes levelek átvitele, mely részek mindegyike különbözõ tartalmakat hordozhat. A szabványt úgy alkották meg, hogy minél egyszerûbb legyen a régi "buta" rendszerekkel való együttmûködés, és hogy a felhasználó lehetõleg akkor is értelmes információhoz jusson, ha levelezõprogramja nem MIME kompatibilis. Ékezetes információk átvitelekor a MIME ajánlást követõ levelezõprogramok a levél fejrészében közlik a kódkészletet, amiben a levelet írták (pl.ISO-8859-2). A szöveget magát a "quoted printable" nevû eljárással kódolják, ami csak az ékezetes karaktereket módosítja: a szöveg többi része változatlan marad, és így a levél olvasható lesz akkor is, ha a fogadó nem tudja dekódolni.

1.3. Néhány Magyarországon használatos kódkészletet preferálási sorrendben.

1.3.1. ISO 8859-2 más néven LATIN2

Jelenleg ez a kódkészlet, amit a legjobban ajánlhatunk. A legtöbb operációs rendszer támogatja. Közel áll több más ékezetes kódkészlethez. Nemzetközi, és magyar szabvány. Minden magyar ékezetes karaktert tartalmaz, és a kis és nagybetûk kódja közti távolság az egész kódtáblában megegyezik.

1.3.2. Microsoft 1250

A Microsoft Windows által használt kódkészlet. A magyar ABC betûit tekintve nem különbözik az ISO 8859-2 kódkészlettõl. Ennek az a gyakorlati következménye, hogy pl. Microsoft Word-ben ékezetesen írt szöveg és ISO 8859-2 szöveg konverzió nélkül egymásba alakulhat.

1.3.3. ISO 8859-1 más néven LATIN1

Fõleg Nyugateurópában használt, de lefed sok nyelvet. Szerencsés módon *majdnem* lehet használni magyar ékezetes karakterek ábrázolására, és azok a magyar ékezetes karaktek, amiket támogat *pontosan* ott helyezkednek el benne, ahol az ISO 8859-2 kódkészletben. A megegyezõ magyar ékezetes karakterek a következõk: Á á É é Í í Ó ó Ö ö Ú ú Ü ü. A hosszú Õ-k helyett hullámos Ö-k, a hosszú Ü-k helyett kalapos Ü-k látszanak, tehát ezek a betûk is értelemzavar nélkül olvashatók ha LATIN2 kódolású szöveget LATIN1 berendezésen jelenítünk meg. Ha LATIN1 szöveget írunk, akkor érdemes arra figyelni, hogy ennek megfelelõen adjuk meg hosszú Ö és Ü kódját, így szövegünket LATIN2 megjelenítés esetén konverzió nélkül, tökéletesen fogják tudni olvasni. Ez gyakorlatilag azt jelenti, hogy hosszú Õ gyanánt hullámos Õ-t (*nem* a kalapos Õ-t), hosszú Û helyett kalapos Û-t érdemes használni.

1.3.4. DEC MCS

Az ISO 8859-1 kódkészlet régebbi változata. A magyar ékezetes karakterek tekintetében pontosan megegyezik a LATIN1 kódkészlettel, tehát majdnem olyan kedvezõ mint a LATIN2.

1.3.5. ISO 10646 más néven Unicode kódkészlet

Az ISO és az Unicode konzorcium közösen 16 bites kódkészletet készített. A kódkészlet -legalább is az európai nyelveket érintõ része könnyen származtatható az ISO 8859 kódkészletbõl. Ha az elsõ byte 0,1,...,8, akkor sorrendben az ISO 8859-1, ISO 8859-2,...,ISO 8859-8 kódkészletnek megfelelõ a második byte. Tehát LATIN2-ben írt szöveget egyszerûen úgy lehet ISO 10646-ra alakítani, hogy a 8 bites kódokat kiegészítjük 16 bitesekké, mindig egy 2-t tartalmazó byte-tal.

1.3.6. IBM PC 852 codepage

Az MS-DOS operációs rendszer által támogatott kódkészlet. Tartalmazza a magyar ékezetes karaktereket, de egészen más helyen. Az MS-DOS 6.22-tõl kezdõdõen az olvasható a leírásokban, hogy az MS-DOS támogatja az ISO 8859 *fontokat*. Ez csak annyit jelent, hogy a karakterek képe egyezik, de maga a kódolás nem. A 852 kódolásnál a kis és nagy ékezetes betûpárok között nem konstans a távolság, elõnye viszont, hogy akódkészlet tartalmazza az MS-DOS alatt megszokott téglalaprajzoló karakterek legnagyobb részét, a szokásos helyén. Az ilyen kódkészlet és LATIN2, LATIN1 DEC-MCS, Unicode között valamilyen programmal konvertálni kell. Ilyen konvertáló programot tartalmaz például Kosta Kostis PC-s ISO 8859 kódokat támogató programcsomagja (ibmxiso és isoxibm), és a SUNOS (dos2unix és unix2dos).

1.3.7. CWI és IBM PC 437 codepage

A 437 kódolás az MS-DOS eredeti, amerikai igények szerint készült kódkészlete. Ez is tartalmaz néhány magyar ékezetes karaktert:

á É é í ó ú Ö ö Ü ü.

Ezek a karakterek megegyeznek a CWI, 852 és 437 kódkészletben. A CWI kódolás az 852 kódolás elõtt készült, hogy a mutatkozó hiányt pótolja. Igyekeztek a 437-hez észszerûen alkalmazkodni: néhány 437 kódkészletû karakter közel álló más ékezetes karakternek feleltethetõ meg, így kézenfekvõ a kódolásuk. Ezek:

A' = A + angström I' = i + kalap /i + hátravesszõ O' = o + hátravesszõ

U' = u + hátravesszõ o" = o + kalap u" = u + kalap.

A hosszú nagy Ö és a hosszú nagy Ü esetén nincs kézenfekvõ megfeleltetés, ezeket önkényesen választották. A hosszú nagy I-nek két megfeleltetése is kínálkozik, a kalapost a régebbi, a másikat az újabb CWI ajánlás követte. A hagyományos IIF programok (ELLA,PETRA,ELF) CWI kódolást használnak, de az ELLA konfigurálható más, pl. LATIN2 kódkészlet szerint is.

1.3.8. 7 bites ASCII

Kényszerûségbõl szorítkozhatunk az angol ABC betûire. Ekkor használhatunk u.n. repülõ ékezetes kódolást. Ilyenkor az ékezetes betûket az ékezet nélküli változat után írt jellel egészítjük ki. Sajnos erre vonatkozóan többféle szokás is elterjedt. Az IIF körben leggyakrabban használt Huninet ajánlás a következõ 3 jelet használja:

' : "

Tehát a 18 magyar ékezetes karakter Huninet ajánlás szerinti repülõékezetes alakja:

A' a' E' e' I' i' O' o' O: o: O" o" U' u' U: u: U" u"

2. Ékezetes karakterek kezelése egyes platformokon

A következõkben sorravesszük az elterjedtebb operációs rendszereket,platformokat. Gyakorlatilag az összes elterjedt platformon van lehetõség arra, hogy LATIN2 karakterkészlettel és MIME kódolással levelezzünk.

2.1. Ékezetek az MS-DOS operációs rendszerben

Megjelenítés:

Ahogy az 1. fejezetben már említettük, számunkra az 437 codepage és a 852 codepage érdekes. A 437 codepage az alapértelmezés MS-DOS környezetben. Ez nem tartalmazza az összes magyar ékezetes karaktert, de tartalmazza a téglalprajzoló karaktereket. A 852 codepage az összes magyar ékezetes karaktert tartalmazza, de "egzotikus" helyen, tartalmazza ezenkívül téglalaprajzoló karakterek jelentõs részét is. Minden esetre ha 852 codepage van beállítva a gépünkön, akkor pl. a norton commander keret részei helyenként szokatlan képet mutatnak. Mint látható a LATIN2 kódkészletet, általában az ISO 8859 vagy az Unicode szabványt az MS-DOS nem támogatja "helybõl". Ezért fejlesztetteki és bocsátotta nagylelkûen rendelkezésre Kosta Kostis a CPI nevû csomagot. Ennek kurrens változata e sorok írásakor 1.12, vagyis a csomagot a CPI112.ZIP fájl tartalmazza. A csomag lehetõvé teszi, hogy az ISO-8859 szabványnak megfelelõen jelenjenek meg a karakterek MS-DOS alatt, tehát nem csak a számunkra érdekes LATIN2 hanem pl. a cirill vagy a görög betûs szövegek megjelenítésére is módot ad. A csomag elérhetõ anonymous FTP-vel a helka.iif.hu gépen.

Terminál input:

MS-DOS alatt használhatunk magyar szabvány szerinti klaviatúrát, CP852 kódkészlettel. Ehhez a következõknek megfelelõen kell megeditálni a CONFIG.SYS file-t:

COUNTRY=036, 852, C:COUNTRY.SYS

INSTALL=C:\DOS\NLSFUNC.EXE

INSTALL=C:\DOS\KEYB.COM

Az AUTOEXEC.BAT-ban pedig:

KEYB HU,852

Kosta Kostis programcsomagja tartalmaz olyan programot, (ISOKB852), amely a begépelt 852 kódokat LATIN2 karakterekké konvertálja.

Számos rezidens program áll rendelkezésre MS-DOS alatt, amelyek módot adnak arra, hogy átdefiniáljuk a klaviatúrát, és két vagy akár több klaviatúrakiosztás között váltsunk. Ilyen program pl. a KEYBGEN.

Ha nincs más megoldás, akkor az ALT gombot lenyomva és a numerikus keypad-on a karakter kódját begépelve mindig bevihetünk ékezetes karaktert.

2.2. Ékezetek Unix operációs rendszerekben

Ahhoz, hogy ékezetes karaktereket tudjunk Unix terminálunkon megjeleníteni, szükség van arra, hogy a teminál driver-nek megmondjuk, hogy 8 bites módon kezelje terminálunkat. Ezt az

stty cs8 -istrip -parenb

paranccsal tehetjük meg. Hogy ezt a parancsot ne kelljen minden egyes logonkor kiadni, célszerû a következõ sorokat betenni pl. a .cshrc file-ba, (feltéve, hogy csh-t, vagy tcsh-t használunk):

.cshrc:

----------------------------------

tty -s

if ($status == 0) stty cs8 -istrip -parenb

----------------------------------

A különbözõ terminálok, X terminálok változatos módokat kínálnak arra, hogy hogyan adjunk meg a terminálról ékezetes karaktereket. Szerepe lehet a Compose és az Alt esetleg a Ctrl billentyûnek. A compose billentyû használatakor 3 karakter egymás utáni leütésével vihetünk be különleges karaktert. Pl. a nagy Á betût így (idézõjelek közt a billentyû neve):

"Compose" + "A" + "'"

Az Alt gomb használatakor vele együtt kell megnyomnunk egy másik billentyût. Rendszerint a nem alfanumerikus billentyûk (pl. a pont, kettõspont) azok, amik ékezetes karaktert adnak ilyen módon.

X terminálokon mód van arra, hogy a klaviatúra egyes gombjait, illetve annak Alt és Control billentyûs változatait újra definiáljuk. Erre használható segédeszköz az Xmodmap.

Ha PC-rõl, kermit programot használva kapcsolódunk Unix rendszerhez, akkor a SET KEY parancs módot ad arra, hogy bármilyen billentyût illetve Alt, Shift, és Ctrl kombinációt tetszõleges módon definiáljunk, és így egy vagy több karakter beadását érjük el. Tehát speciálisa ékezetes karaktereink is tetszé szerinti helyen lehetnek. Érdemes ezeket a definiciókat az MSKERMIT.INI file-ba betenni, hog automatikusan érvényre jussanak.

A PC-s karakterkészletek konvertálásához használatos program Unix környezetben a

dos2unix (MS-DOS kódkészlet ->ISO irány) és a unix2dos (ISO -> MS-DOS irány).

2.3. Ékezetek OpenVMS operációs rendszerben

A VMS "anyanyelve" a DEC-MCS karakterkészlet, ami - amint arról már szó volt -, az ISO-8859-1 egy másik neve. Ha ezt használjuk, akkor érdemes arra figyelni, hogy a hosszú õ gyanánt hullámos (tilde) o-t írjunk. Hosszú û helyett pedig kalapos (circumflex) u-t.

A VMS rendszerekkel gyakran együtt használt VT sorozatú terminálokon az F3 (setup) gomb leütésével egy menüt kapunk, ahol számos tulajdonságot beállíthatunk. Itt állíthatjuk be a klaviatúra kiosztást is.

A VMS rendszereken gyakran használt az MX szabadon terjeszthetõ levelezõprogram. Ennek egy kellemes tulajdonsága, hogy a MIME kódolású ékezetes leveleket automatikusan dekódolja.

3. Ékezetes karaktereket támogató levelezõprogramok

Az itt felsorolt programok mind egymással és a nemzetközi szabványokkal kompatibilis módon támogatják a levelek TÖRZSÉBEN az ékezetes szövegek küldését. Megjegyzendõ, hogy a levelek fejrészében, tehát pl. a Subject mezõben és a felhasználók nevének megadásakor, általában NEM használhatók csak a 7 bites ASCII karakterek.

3.1. Pegazus Mail, és WinPmail

A Pegazus más néven Pmail Ausztráliából származó szabadon terjeszthetõ PC-s levelezõprogram, alkotója David Harris. Az MTA SZTAKI-ban elkészült a program magyar nyelvû változata. Az angolul beszélõ és a magyarul beszélõ változat is elérhetõ anonymous ftp-vel a helka.iif.hu géprõl. A programnak van MS Windows változata is (WinPmail). Használható NOVELL környezetben, vagy egy Unix/VMS géphez kapcsolódva, ahonnan POP (Post Office Protocol) segítségével olvashatja a leveleket. A Pegazus támogatja a MIME átvitelt, és a LATIN2 kódolást. Amikor levelet küldünk az F9 gomb megnyomásával a olyan menüt kapunk, ahol különbözõ paramétereket állíthatunk be. Itt állítsuk be a MIME atttribútumot. Erre a Pegazus MIME kódolással küldi a levelet. Megjegyzendõ, hogy legközelebb nem lesz szükségünk újra beállítani ezt az attribútumot, mert a Pegazus megjegyzi a választásunkat, és legközelebb ez lesz az alapértelmezés. A konverziót a Pegazus konfigurációja határozza meg. Alapértelmezésben olyan konverziós táblát használ, ami a MIME karakterkészlet (pl. a LATIN2) és az amerikában használt PC kódkészlet, a CP437 között konvertál. Mivel nem minden karakternek van pontos mása, a konverzió nem lehet tökéletes. Ha PC-nken nem a CP437-es karaktrekészletet használjuk, hanem a CP852-t, vagy a LATIN2-t (pl. a Kostos féle csomag segítségével), akkor célszerû módosítani a konverziót. Ezt nem bonyolult megtenni. A Pegazus kezel egy sor u.n. resource fájlt. Ezekkel lehet módosítani a mûködését. Pl. meg lehet tenni, hogy egy véletlenszerû bölcs/vicces mondást illesszen minden kimenõ levelünk végére, és a készletet, amibõl választ magunk szerkeszthetjük. Hasonlóan meghatározhatjuk a MIME üzenetek dekódolásának táblázatát. A táblázatot azután két irányba fogja használni a program, vagyis a kimenõ levelekben a helyi karakterkészletet a táblázatnak megfelelõen ISO megfelelõjükre konvertálja. A fájl, amit módosítanunk kell a PM-LMTT.R

Miután elkészítettük egy új változatát, a

RESCOM PM-LMTT.R

paranccsal egy bináris, a Pegazus által olvasott PM-LMTT.RSC file keletkezik. Másoljuk a fájl oda, ahol a PMAIL.EXE fájl van. Ha ez egy többek által használt hálózati direktori, akkor minden felhasználó számára ez lesz érvényes. A felhasználók - ha szükséges - felülbírálhatják egy másik PM-LMTT.RSC fájl segítségével, amit a leveleik direktoriába (home mailbox) kell másolniuk.

A CP852-nek és a LATIN2-nek megfelelõ PM-LMTT.R fájl elérhetõ anonymous ftp-vel a helka.iif.hu gépen.

3.2. ELLA

Az ELLA magyar fejlesztésû levelezõrendszer. Kliens-szerver modell szerint mûködik. A szerver eredetileg egy IBM nagygépen VM operációs rendszer alatt futó program volt, ma a helka.iif.hu gépen fut Unix alatt. A kliensek PC-n, MS-DOS alatt mûködnek. Az ELLA módot ad ékezetes levelezésre. Alapértelmezésben a CWI kódolást támogatja, de minden felhasználó definiálhat konverziós táblázatot, ami azt eredményezi, hogy a helyi gépen lehet például LATIN2 vagy CP852 kódban is dolgozni. Az ELLA esetén is - a Pegazushoz hasonlóan - csak a felhasználó felé konvertáló táblázatot kell megszerkeszteni, fordított irányban a program automatikusan konvertál, elkészítve a megadott táblázat inverzét. A konverziós táblázat szerkesztését az ELLA "Konfiguráció" menüpontjának "LocTab" alpontja alatt tehetjük meg.

A HELKA.IIF.HU-n futó ELLA központ segítségével az ELLA felhasználók MIME kompatibilis módon levelezhetnek Internet partnereikkel LATIN2 karakterkészlettel, mert a központ az ELLA kliensektõl CWI kódban kapott üzeneteket LATIN2-be konvertálja, és MIME szabvány szerint továbbítja. A MIME üzeneteket pedig dekódolva és CWI szerint továbbítja a kliens programoknak.

3.3. Eudora

Az Eudora Macintoshon és MS-Windows alatt mûködõ levelezõprogram. Van pénzért kapható, és szabadon terjeszthetõ változata is. Az ékezetes levelek MIME szabvány szerinti forgalmazását támogatja.

3.4. PINE

A PINE az Egyesült Államokból származó szabadon terjesztehetõ levelezõprogram és NEWS kliens. Van Unix, VMS sõt MS-DOS alatt mûködõ változata is bár ez utóbbi még nem elég kiforrott. Mind támogatja a MIME szabvány szerinti átvitelt. A Pegazusnál a felhasználónak kell dönteni, hogy ékezetes levelét MIME kódolással akarje e küldeni, itt nincs is más lehetõség. A PINE a felhasználó bejelentkezési (login) könyvtárában található .pinerc inicializáló fájlt használja. Itt kell megadnunk a kódkészletet (ISO-8859-2), amit használunk. A PINE kellemes tulajdonsága, hogy menüvezérelt, használat közben kézikönyv nélkül tanulható a használata. Megjegyzendõ , hogy a PINE alkalmas arra is, hogy távoli számítógépekrõl is olvashassunk leveleket TCP/IP fölött, IMAP protokoll segítségével.

4. Magyar ékezetek használatát elõsegítõ segédprogramok

4.1. Kermit

A Kermit népszerû fájlátviteli és terminál emulációs program. Az MS-DOS alatt mûködõ változata sokféleképpen támogatja a különbözõ karakterkészletek közötti konverziót. Beállíthatjuk, hogy a helyi és a távoli karakterkészletet, mégpedig egymástól függetlenül fájlátvitel és terminál emuláció dolgában. A Kermit azután az egymásnak megfelelõ karaktereket automatikusan konvertálja. Ha nincs pontos megfelelés, akkor a közelálló karakterrel helyettesít, például a karakter ékezet nélküli változatával. Íme két példa arra, hogy hogyan kell beállítani a Kermit paramétereket. Célszerû ezeket a beállításokat az MSKERMIT.INI fájlba beírni.

A PC-n IBM852 karakterkészlet, a távoli gépen LATIN2:

SET TER CHAR LATIN2

SET TRANSFER CP852

SET TER CODEPAGE 852

A PC-n LATIN2 karakterkészlet, a távoli gépen is LATIN2:

SET TER CHAR TRANSPARENT

SET TRANSFER CHAR TRANSPARENT

SET TER CODEPAGE 852

4.2. Kosta Kostis programcsomagja

Egy Németországban élõ görög fiatalember készített egy programcsomagot, amely alkalmas arra, hogy ISO szabvány szerinti karakterkészletet használjunk MS-DOS alatt. A következõket valósította meg: - ISO kompatibilis fontkészletek, mind a 8 ! Ezek a fontkészletek értelemszerûen nem tartalmazzák a téglalaprajzoló karakterket, de a csomag tartalmaz olyan parancsfile-t, amivel egyszerûen, gyorsan lehet váltani pl. CP852 és LATIN2 fontkészlet között, akár pl. egy editálás megszakítása nélkül.

Klaviatúra átdefiniáló programok:

Ezek lehetõvé teszik, hogy ha pl. MS-DOS szerinti magyar klaviatúrát állítottunk be PC-nken, akkor a szabványos helyen beadott ékezetes karakter ne a CP852, hanem a LATIN2 szabvány szerinti legyen.

File konverziós programok:

Az ISO és az IBM kódkészletek közt lehet segítségükkel file-okat konvertálni.

5. Kódkészlet táblázat

              CWI         CP 852,       ISO-8859-2,    Huninet repülõ  
                         MSZ 7795-3     MSZ 7795-3         ékezet
      
    Á          8f            b5             c1               A'        
    á          a0            a0             e1               a'        
    É          90            90             c9               E'        
    é          82            82             e9               e'        
    Í        8c/8d           d6             cd               I'        
    í          a1            a1             ed               i'        
    Ó          95            e0             d3               O'        
    ó          a2            a2             f3               o'        
    Ö          99            99             d6               O:        
    ö          94            94             f6               o:        
    Õ          a7            8a             d5               O"        
    õ          93            8b             f5               o"        
    Ú          97            e9             da               U'        
    ú          a3            a3             fa               u'        
    Ü          9a            9a             dc               U:        
    ü          81            81             fc               u:        
    Û          98            eb             db               U"        
    û          96            fb             fb               u"