Studium, Ausbildung und Beruf

web uni-protokolle.de
 powered by
NachrichtenLexikonProtokolleBücherForenFreitag, 19. Dezember 2014 

Extensible Markup Language


Dieser Artikel von Wikipedia ist u.U. veraltet. Die neue Version gibt es hier.
XML (Extensible Markup Language) ist ein Begriff aus der Computertechnik und bezeichnet einen Standard zur Definition von Auszeichnungssprachen der als vereinfachte Teilmenge von SGML konzipiert wurde.

Gleichzeitig steht XML in einer losen Verwandtschaft zu HTML welches ursprünglich (d. h. bis einschließlich Spezifikationsversion 4.01) selbst als Anwendung von SGML definiert wurde. Mit der "Extensible HyperText Language" ( XHTML ) wurde der Übergang zu XML als vollzogen. Grund dafür war die einfachere Syntax damit die Entwicklung einfacherer Parser (die Definition von SGML umfasst 500 Seiten jene von XML 26).

Die Namen der einzelnen Strukturelemente für eine bestimmte Auszeichnungssprache lassen sich frei wählen diese Auszeichnungssprachen dabei alle möglichen Daten beschreiben als prominentestes Text aber auch Grafiken oder abstraktes Wissen. Grundgedanke hinter XML ist es Daten und ihre Repräsentation zu trennen. Also beispielsweise Wetterdaten einmal als Tabelle oder als Grafik auszugeben aber für beide Anwendungen die Datenbasis im XML- Format zu nutzen.

Inhaltsverzeichnis

Fachtermini

Eine XML-Datei die als wohlgeformt bezeichnet wird muss die Regeln für XML korrekt einhalten (was z. Verschachtelungen von Elementen betrifft).

Programme die XML-Daten verarbeiten nennt man XML- Parser .

Soll XML für den Datenaustausch verwendet werden so sollten die Daten Dokumenttypdefinition oder einem XML Schema entsprechen.

Aufbau einer XML-Datei

Beispiel einer XML-Datei

 <?xml version="1.0"?> <enzyklopaedie> <eintrag> <stichwort>Genf </stichwort> ist der Sitz von...</eintragstext> </eintrag> </enzyklopaedie>  

XML- Dateien sind hierarchisch strukturiert. Die Dateien sind da ihre Kodierung angegeben wird. Der Standard ist Unicode genauer gesagt UTF-8 .

XML- Dokumente können folgende Objekte enthalten:

Dabei sind die Verarbeitungsanweisungen und die einer DTD mittlerweile obsolet. Eine XML Datei genau ein Element in der obersten Ebene Unterhalb von diesem Wurzelelement können weitere Elemente werden.

Einige Web-Browser können XML-Dateien mit Hilfe eines eingebauten Parsers direkt darstellen. Dies geschieht in Verbindung mit einem Stylesheet . Diese Transformation kann die Daten in ein komplett Format umwandeln das Zielformat muss nicht einmal sein.

Vorgänger von XML

Obwohl der Vorgänger SGML bereits weitaus umfangreicher war kam es zu einer breiten Akzeptanz in der Öffentlichkeit. Grund dafür liegt in der Komplexibilität SGMLs die die Softwareentwicklung stark erschwert. Der Bedarf nach einem weltweiten Informationssaustausch und die Popularität von HTML brachten das deutlich einfachere XML hervor in den letzten Jahren einen starken Boom

Kerntechnologien

Die Kerntechnologien im XML Umfeld kann grob aufteilen in: APIs zur Verarbeitung von XML und Sprachen um XML zu beschreiben.

APIs zur Verarbeitung von XML

SAX

SAX ist eine standardisierte Möglichkeit wie eine Datei geparst werden kann. Hierbei wird ein in einen Strom von Ereignissen umgewandelt. Programme sich für einzelne Ereignisse registrieren um bei ihre Arbeit zu verrichten. Die Eingabedaten werden sequentiell verarbeitet. Ein Vorteil von SAX ist die gesamte XML Datei nie im Speicher muss das ist aber dann ein Nachteil man viele Informationen die über die ganze verstreut sind zur Verarbeitung benötigt.

DOM

DOM (Document Object Model) ist der zweite um XML Dateien auszuwerten und wurde vom W3C standardisiert. Er stellt wie der Name sagt ein standardisiertes Objektmodell zur Verfügung mit Hilfe der Inhalt der XML-Datei ausgewertet oder werden kann. Zum Aufbauen des Objektbaumes muss zunächst die gesamte Datei eingelesen werden wofür Speicher benötigt wird. Vorteilhaft ist dass alle in einer hierarchischen Struktur vorliegen und auf gleichermaßen zugegriffen werden kann da die Elemente in Beziehung stehen (Eltern Geschwister Kinder). Größter von DOM ist der hohe Speicherbedarf der proportional zur Größe der Eingabedatei verhält. Jedoch Programme die auf DOM basieren im Allgemeinen zu verstehen. Beide Modelle haben aufgrund ihrer und Nachteile unterschiedliche Anwendungsgebiete.

Metasprachen

Es gibt zwei standardisierte Möglichkeiten um Struktur von XML Dokumenten zu beschreiben Dokumenttypdefinitionen oder mit XML Schema .

DTD

Eine DTD ( Dokumenttypdefinition ) ist eine Beschreibung eines XML Dokuments. wurde zusammen mit XML standardisiert. Mit einer kann allerdings nicht sehr strikt beschrieben werden eine XML Datei aussehen darf. Ein weiterer ist die Tatsache dass die DTD in eigenen Sprache abgefasst werden muss.

XML Schema

XML Schema ist die moderne Möglichkeit Dokumente zu beschreiben. Ein Schema ist selbst XML Dokument das es erlaubt komplexere Zusammenhänge mit einer DTD zu beschreiben.

Überblick über XML Sprachen

XML Sprachen kommen in allen erdenklichen zum Einsatz.

Text

Grafik

XML Infrastruktur

Web Services

Weitere

Hier noch nicht behandelt:

Siehe auch : RDF XTM XML-Datenbank Spezial:Export

Anwendungen die XML benutzen

  • Editoren
    • XML Spy
    • Eclipse
    • XMetaL
    • Epic

  • Office
    • OpenOffice.org
    • Microsoft Office (Seit der Version "Office 2003" ist Editieren von speziellen XML Dateien möglich zuvor nur eine unzulängliche XML-Unterstützung vorhanden)
    • AbiWord

Literatur

Weblinks




Bücher zum Thema Extensible Markup Language

Dieser Artikel von Wikipedia unterliegt der GNU FDL.

ImpressumLesezeichen setzenSeite versendenSeite drucken

HTML-Code zum Verweis auf diese Seite:
<a href="http://www.uni-protokolle.de/Lexikon/XML.html">Extensible Markup Language </a>