Forstå skript og tegntabeller

Microsoft Outlook 2003

Forstå skript og tegntabeller

Skript

Flerspråklige meldinger og elementer kan inneholde tekst på språk som krever ulike skript. Et enkelt skript kan brukes til å representere mange språk.

Latinske skript har for eksempel tegn – symboler – for de 26 bokstavene (både store og små bokstaver) i det engelske alfabetet, i tillegg til tegn med aksent (utvidet), som brukes til å representere lyder i andre vesteuropeiske språk.

Latinske skript har symboler som representerer alle tegnene i de fleste europeiske språk, og noen andre. Andre europeiske språk, for eksempel gresk eller russisk, har tegn som det ikke er symboler for i latinske skript. Disse språkene har egne skript.

Noen asiatiske skript bruker ideografiske skript med symboler som baseres på kinesiske tegn. Andre språk, for eksempel thai og arabisk, bruker skript med symboler som består av mange mindre symboler, eller symboler som må formes på en annen måte avhengig av tilstøtende tegn.

En vanlig måte å lagre ren tekst på er å representere hvert tegn ved å bruke en enkel byte. Verdien av hver byte er et numerisk register eller kodepunkt i en tabell med tegn. Et kodepunkt tilsvarer et tegn i standard tegntabell på datamaskinen som tekstdokumentet er opprettet på. En byteverdi av desimal 189 (kodepunktet for desimalverdien 189) representerer for eksempel forskjellige tegn i forskjellige tegntabeller.

Tegntabeller

En tabell med tegn som er gruppert sammen, kalles en tegntabell. For tegntabeller med én byte, inneholder hver tegntabell maksimalt 256 byteverdier. Siden hvert tegn i tegntabellen representeres ved én byte, kan en tegntabell inneholde så mange som 256 tegn.

En tegntabell med en begrensning på 256 tegn får ikke plass til alle språk siden alle språk til sammen bruker mye mer enn 256 tegn. Derfor bruker forskjellige skript forskjellige tegntabeller. Det er én tegntabell for gresk, en annen for japansk og så videre.

I tillegg får ikke tegntabeller med én byte plass til de fleste asiatiske språk, som vanligvis bruker mer enn 5 000 kinesiskbaserte tegn. Tegntabeller med dobbel byte ble utviklet for å støtte disse språkene.