Denne artikkelen forklarer hvordan du kan skrive velformet XML ved å vise et eksempel. Web Writer-nyhetsbrevet er skrevet ved hjelp av en form for XML; vi kaller det AML eller About Markup Language. Selv om dette er et arbeidsdokument, er det ikke et godt utformet eller gyldig XML-dokument.
Velformet
Det er noen spesifikke regler for å lage et godt utformet XML-dokument:
- XML-erklæringen må komme først i hvert dokument.
- Kommentarer er ikke gyldige i en tag. Kommentarer kan ikke inneholde to bindestrek på rad, bortsett fra begynnelsen og slutten av kommentaren.
- Tagger må for eksempel ha en sluttkode, eller være lukket i selve singleton-koden.
- Alle attributter for koder må siteres, helst dobbelt anførselstegn, med mindre attributtet i seg selv inneholder et dobbelt tilbud.
- Hvert XML-dokument må inneholde ett element som inneholder alle de andre elementene.
Det er bare to problemer med dokumentet som gjør at det ikke er godt utformet:
- Det første AML-dokumentet trenger er en erklæring om XML-erklæring.
- Det andre problemet er at ingen elementer helt lukker alle de andre elementene. For å fikse dette legger vi til et eksternt containerelement:
Å gjøre disse to enkle endringene (og sikre at alle elementene bare inneholder CDATA) vil gjøre det ikke-velformede dokumentet til et godt dannet dokument.
Et gyldig XML-dokument er validert mot en Document Type Definition (DTD) eller XML-skjema. Dette er et sett med regler opprettet av utvikleren eller en standardorganisasjon som definerer semantikken i XML-dokumentet. Disse forteller datamaskinen hva de skal gjøre med markeringen.
I tilfelle About Markup Language, siden dette ikke er et standard XML-språk, som XHTML eller SMIL, vil DTD opprettes av utvikleren. At DTD mest sannsynlig ville være på samme server som XML-dokumentet og referert til øverst i dokumentet.
Før du begynner å utvikle en DTD eller et skjema for dokumentene dine, bør du innse at et XML-dokument bare er velformet, og som ikke beskriver en DTD.
For eksempel med vårt velformede AML-dokument er det følgende tagger:
Hvis du er kjent med Web Writer-nyhetsbrevet, kan du gjenkjenne de forskjellige delene av nyhetsbrevet. Dette gjør det veldig enkelt å lage nye XML-dokumenter i samme standardformat. Vi legger alltid tittelen i full lengde i koden, og den første seksjonen URL i koden.
DTD-er
Hvis du må skrive et gyldig XML-dokument, enten for å bruke dataene eller for å behandle det, vil du inkludere det i dokumentet ditt med koden. I denne koden definerer du basen XML-koden i dokumentet og plasseringen av DTD (vanligvis en web-URI).
For eksempel:
En fin ting med DTD-erklæringer er at du kan erklære at en DTD er lokal for systemet der XML-dokument er med "SYSTEM." Du kan også peke på en offentlig DTD, for eksempel med et HTML 4.0-dokument:
Når du bruker begge deler, ber du dokumentet om å bruke en bestemt DTD (offentlig identifikator) og hvor den skal finnes (systemidentifikatoren).
Til slutt kan du inkludere en intern DTD direkte i dokumentet, i DOCTYPE-koden. For eksempel (dette er ikke en komplett DTD for AML-dokumentet):
XML-skjema
For å opprette et gyldig XML-dokument, kan du også bruke et XML Schema-dokument til å definere XML. XML Schema er et XML-dokument som beskriver XML-dokumenter. Lær hvordan du skriver et skjema.
Merk
Bare det å peke på et DTD- eller XML-skjema er ikke nok. XML som er i dokumentet må følge reglene i DTD eller skjema. Å bruke en validerende parser er en enkel måte å kontrollere at XML følger DTD-reglene. Du kan finne mange slike parsere på nettet.