Gleichzeitig steht XML in einer losen Verwandtschaft zu HTML welches ursprünglich (d. h. bis einschließlich Spezifikationsversion 4.01) selbst als Anwendung von SGML definiert wurde. Mit der "Extensible HyperText Language" ( XHTML ) wurde der Übergang zu XML als vollzogen. Grund dafür war die einfachere Syntax damit die Entwicklung einfacherer Parser (die Definition von SGML umfasst 500 Seiten jene von XML 26).
Die Namen der einzelnen Strukturelemente für eine bestimmte Auszeichnungssprache lassen sich frei wählen diese Auszeichnungssprachen dabei alle möglichen Daten beschreiben als prominentestes Text aber auch Grafiken oder abstraktes Wissen. Grundgedanke hinter XML ist es Daten und ihre Repräsentation zu trennen. Also beispielsweise Wetterdaten einmal als Tabelle oder als Grafik auszugeben aber für beide Anwendungen die Datenbasis im XML- Format zu nutzen.
Dabei sind die Verarbeitungsanweisungen und die einer DTD mittlerweile obsolet. Eine XML Datei genau ein Element in der obersten Ebene Unterhalb von diesem Wurzelelement können weitere Elemente werden.
Obwohl der Vorgänger SGML bereits weitaus umfangreicher war kam es zu einer breiten Akzeptanz in der Öffentlichkeit. Grund dafür liegt in der Komplexibilität SGMLs die die Softwareentwicklung stark erschwert. Der Bedarf nach einem weltweiten Informationssaustausch und die Popularität von HTML brachten das deutlich einfachere XML hervor in den letzten Jahren einen starken Boom
SAX ist eine standardisierte Möglichkeit wie eine Datei geparst werden kann. Hierbei wird ein in einen Strom von Ereignissen umgewandelt. Programme sich für einzelne Ereignisse registrieren um bei ihre Arbeit zu verrichten. Die Eingabedaten werden sequentiell verarbeitet. Ein Vorteil von SAX ist die gesamte XML Datei nie im Speicher muss das ist aber dann ein Nachteil man viele Informationen die über die ganze verstreut sind zur Verarbeitung benötigt.
DOM (Document Object Model) ist der zweite um XML Dateien auszuwerten und wurde vom W3C standardisiert. Er stellt wie der Name sagt ein standardisiertes Objektmodell zur Verfügung mit Hilfe der Inhalt der XML-Datei ausgewertet oder werden kann. Zum Aufbauen des Objektbaumes muss zunächst die gesamte Datei eingelesen werden wofür Speicher benötigt wird. Vorteilhaft ist dass alle in einer hierarchischen Struktur vorliegen und auf gleichermaßen zugegriffen werden kann da die Elemente in Beziehung stehen (Eltern Geschwister Kinder). Größter von DOM ist der hohe Speicherbedarf der proportional zur Größe der Eingabedatei verhält. Jedoch Programme die auf DOM basieren im Allgemeinen zu verstehen. Beide Modelle haben aufgrund ihrer und Nachteile unterschiedliche Anwendungsgebiete.
Eine DTD ( Dokumenttypdefinition ) ist eine Beschreibung eines XML Dokuments. wurde zusammen mit XML standardisiert. Mit einer kann allerdings nicht sehr strikt beschrieben werden eine XML Datei aussehen darf. Ein weiterer ist die Tatsache dass die DTD in eigenen Sprache abgefasst werden muss.
XML Schema ist die moderne Möglichkeit Dokumente zu beschreiben. Ein Schema ist selbst XML Dokument das es erlaubt komplexere Zusammenhänge mit einer DTD zu beschreiben.
Microsoft Office (Seit der Version "Office 2003" ist Editieren von speziellen XML Dateien möglich zuvor nur eine unzulängliche XML-Unterstützung vorhanden)