Om XML
Extensible Markup Language, eller XML, er et kodespråk som er definert av World Wide Web Consortium (W3C) sin XML Working Group. XML ligner på Hypertext Markup Language (HTML) ved at det er et kodebasert språk som er laget spesielt for å publisere informasjon på weben. XML er forskjellig fra HTML ved at kodene ikke er forhåndsdefinerte. I stedet inneholder W3C sin XML-anbefaling et sett med regler som må følges for at du skal kunne lage dine egne koder.
Du kan lage dine egne koder som du kan bruke i et XML-dokument, ved å følge noen få enkle regler:
Et XML-dokument kan bare inneholde ett rotelement. Rotelementet i et XML-dokument er ett enkelt element som inneholder alt innholdet som regnes som en del av selve dokumentet. Rotelementet er det første elementet som kommer etter dokumentets prologdel. Rotelementet er også kjent som dokumentelementet.
Alle XML-elementer må inneholde sluttkoder. Selv om sluttkoder er valgfrie med enkelte HTML-dokumentelementer, må alle elementer i et XML-dokument ha en sluttkode.
Start- og sluttkoder for elementer må være identiske. Det skilles mellom store og små bokstaver i XML. Derfor må navnet på en sluttkode samsvare nøyaktig med navnet på den tilhørende startkoden.
XML-elementer kan ikke overlappe. Hvis startkoden for et element vises i et annet element, må det slutte i det samme omsluttende elementet.
Alle attributtverdier må bruke anførselstegn. Attributtverdier må stå i enkle eller doble anførselstegn.
Du kan ikke bruke følgende tegn i teksten i et XML-dokument: < > & Dette er spesialtegn som har en bestemt mening for XML-parsere. Hvis du trenger å bruke disse tegnene i teksten i XML-dokumentet, må du bruke forhåndsdefinerte tegn- eller enhetsreferanser.
Hvis du følger disse reglene, sørger du for at XML-dokumentet er i riktig format, som betyr at det overholder XML-syntaksen i henhold til W3C-anbefalingen. XML-dokumenter anses for å ha gyldig XML hvis de bruker et XML-skjema til å begrense hvilken type data som kan brukes i XML-dokumentet.
XML-dokumenter består av to primære deler: en prolog og et rotelement. XML-dokumenter kan også inneholde kommentarer.
Prolog
Prologen er den første delen av et XML-dokument. Det inneholder XML-deklarasjonen, som angir at dokumentet er et XML-dokument; behandlingsinstruksjoner, som gir informasjon som brukes av XML-parsere til å avgjøre hvordan dokumentet skal håndteres; og skjemadeklarasjoner, som bestemmer hvilke XML-skjemaer som skal brukes til å kontrollere at dokumentet er gyldig. Det følgende er et eksempel på en prolog i et XML-dokument:
<?xml version="1.0" encoding="UTF-8"?>
Rotelement
Rotelementet er hoveddelen av et XML-dokument. Det inneholder dataene i dokumentet og informasjon som beskriver strukturen til dataene. Det følgende er et eksempel på rotelementdelen i et XML-dokument:
<Employees>
...
</Employees>
Informasjon i rotelementet lagres i to typer XML-"construct"-er: elementer og attributter. Alle elementene og attributtene som brukes i et XML-dokument, er nestet i rotelementet.
Elementer Elementer er de primære byggeklossene i et XML-dokument. De brukes til å representere både strukturen til og dataene i XML-dokumentet. Elementer inneholder en startkode, innhold og en sluttkode. Siden det skilles mellom store og små bokstaver i XML, må start- og sluttkoden samsvare nøyaktig. Det følgende er et eksempel på et enkelt Employee-element som beskriver navnet på en ansatt. Employee-elementet er nestet i et rotelement med navnet Employees:
<Employees>
<Employee>
<Name>Patricia Doyle</Name>
</Employee>
</Employees>
Elementer kan inneholde tekst, andre elementer, tegnreferanser eller tegndatadeler. Elementer som ikke har noe innhold, kalles tomme elementer. Start- og sluttkoden for et tomt element kan kombineres til én kode, slik som i følgende eksempel:
<Name/>
Attributter Attributter er XML-"construct"-er som bruker et navn/verdi-par som er tilknyttet et bestemt element. De inneholder informasjon om elementets innhold som ikke nødvendigvis er ment å skulle vises, men som i stedet brukes til å beskrive en egenskap ved elementet. Attributtverdier står i enkle eller doble anførselstegn, er atskilt fra navnet på attributtet med et likhetstegn og omsluttet av elementets startkode. Det følgende er et eksempel på et EmployeeNumber-attributt som er tilknyttet et Nameelement:
<Employees>
<Employee>
<Name EmployeeNumber="10101">Patricia Doyle</Name>
</Employee>
</Employees>
Kommentarer
XML-dokumenter kan også inneholde kommentarer. Kommentarer behandles ikke av XML-parseren, men brukes til å gi meningsfylt dokumentasjon i XML-kilden for dokumentet. Kommentarer begynner med<!--
og slutter med -->
. Teksten mellom disse tegnene ignoreres av XML-parseren. Det følgende er et eksempel på en kommentar i et XML-dokument:
<!-- This XML document contains employee information. -->
<Employees>
<Employee>
<Name EmployeeNumber="10101">Patricia Doyle</Name>
</Employee>
</Employees>