Abbiamo detto che XML è un metalinguaggio e che consente di creare infiniti tag. Questo non significa, tuttavia, che XML non sia un linguaggio rigoroso. La sua "libertà" non deve essere fraintesa.
Per creare un documento XML è necessario, infatti, rispettare una serie ben precisa di regole sintattiche. Un documento XML si definisce well formed quando è conforme alle regole di sintassi descritte di seguito.
Una sola radice
Ogni documento XML deve avere uno ed un solo elemento radice.
Chiudere sempre i tag
In XML, a differenza di HTML, tutti i tag devono essere chiusi. Se in HTML il seguente markup può essere considerato valido:
<p>paragrafo1
<p>paragrafo2
In XML sarebbe fonte di errori. La sintassi del documento XML dovrebbe essere questa:
<p>paragrafo1</p>
<p>paragrafo2</p>
Rispettare l’ordine di apertura e chiusura dei tag
In XML tutti i tag devono essere correttamente innestati secondo un ordine ben preciso. In HTML questo markup sarebbe corretto:
<i><b>corsivo e grassetto</i></b>
Viceversa in XML no. La giusta sintassi sarebbe questa:
<i><b>corsivo e grassetto</b></i>
Utilizzare gli apici per i valori degli attributi
Gli attributi devono sempre essere inclusi tra apici. La seguente sintassi, pertanto, produrrebbe un errore:
<nota data=11/11/2004>
La sintassi corretta sarebbe questa:
<nota data="11/11/2004">
XML è case sensitive
Come già più volte detto XML è case sensitive, quindi le maiuscole e le minuscole devono essere rispettate. Di seguito un esempio di codice XML non corretto:
<data>11/11/2004</Data>
L’errore è dovuto al fatto che il tag di apertura e quello di chiusura non sono scritti in modo uguale.
Attenzione agli spazi
Differentemente da quanto accade in HTML (dove si dice che gli spazi multipli collassano in uno), in XML gli spazi vengono preservati.