Studium, Ausbildung und Beruf

web uni-protokolle.de
 powered by
NachrichtenLexikonProtokolleBücherForenDonnerstag, 24. April 2014 

Hypertext Markup Language


Dieser Artikel von Wikipedia ist u.U. veraltet. Die neue Version gibt es hier.
Die Hypertext Markup Language (HTML) ist ein Dokumentenformat zur Auszeichung von Hypertext im World Wide Web und wurde 1989 von Tim Berners-Lee am CERN in Genf festgelegt. Sie basiert dabei der Metasprache SGML die zur Definition von Auszeichnungssprachen verwendet wird. HTML ist also eine Auszeichnungssprache zur Beschreibung von Informationen in Hypertexten.

Auch wenn sich ältere HTML-Versionen dafür lassen geht es in HTML also nicht die optische Gestaltung eines Textes. Vielmehr lassen einzelnen Textbereichen einzelne semantische Funktionen (Bedeutungen) zuordnen Überschrift) deren optische Gestaltung hierbei nebensächlich ist mit CSS festgelegt werden kann. Beispielsweise gibt es HTML-Element zur Hervorhebung von Textbereichen. Was ein daraus macht ist Sache des Webbrowsers nicht von HTML. Ob ein mit diesem Element Textabschnitt vom Webbrowser durch Kursivschrift Fettschrift oder auffällige Farbe realisiert wird. Dies kann mit von CSS festgelegt werden.

Mittlerweile wurde die letzte Version des (HTML 4.01) in der Meta-Sprache XML neu formuliert. Das daraus entstandene XHTML 1.0 genügt den im Vergleich zu SGML syntaktischen Regeln von XML ist aber in drei DTD -Varianten (Strict Transitional und Frameset siehe unten ) semantisch mit der jeweils entsprechenden DTD-Variante von 4.01 identisch. Aktuell liegt der XHTML-Standard in Version 1.1 vor der eine zusätzliche Modularisierung Elemente einführt.

Inhaltsverzeichnis

Überblick

Namensgebend sind die Hypertext-Elemente die zum auf andere Textstellen oder auf ein anderes dienen. Zur Adressierung anderer Dokumente im Internet innerhalb des Dokumentes Hyperlinks verwendet. Dies ist die Grundlage für WWW . Die Programme die die Struktur und logischen Aufbau des Dokuments interpretieren und als Webseiten (eventuell mit Interaktionselementen wie Links oder darstellen werden Webbrowser genannt.

Dem Text wird durch Auszeichnung (engl. mark-up ) von Textteilen mit in der Regel (öffnenden und schließenden) Tags eine Struktur und Logik verliehen. Die zusammengehörenden Tags bilden zusammen mit dem Inhalt den Tags ein Element . Diese Elemente lassen sich nach Regeln in einer Dokumenttypdefinition ( DTD ) angegeben sind verschachteln: <p>Ein Textabsatz der ein <em>betontes</em> Wort enthält.</p>

Neben Elementen mit Start- und End-Tag es auch leere Elemente wie etwa Zeilenumbrüche Bilder: Eine Textzeile <br> die hier fortgesetzt wird. <img src="E-Mail-Button.jpg" alt="E-Mail" title="Schreiben Sie mir eine (Anmerkungen: zur Übersicht sind die Attribute worden dies ist nicht nötig aber erlaubt. Zeilenumbruch entspricht im HTML-Quellkode einem Leerzeichen.)

Dabei sind diese Tags keine Präsentations-Befehle das in Zeiten von HTML 3.2 so die dem interpretierenden Webbrowser mitteilen er müsse bis zum Auftreten des Endtags alles in setzen sondern eine strukturgebende oder logische Auszeichnung Repräsentation von der Umgebung abhängig ist. Obwohl in der Regel auf Computerbildschirmen dargestellt werden man sie auch auf anderen Medien ausgeben etwa auf Papier oder als Sprachausgabe.

Auf die Präsentation in verschiedenen Medien mit HTML kein Einfluss genommen werden dazu sich CSS vorzüglich. Daher sollten Elemente und Attribute Präsentation wie <i>...</i> <font>...</font> width ... vermieden werden und stattdessen nur verwendet werden die tatsächlich der Textauszeichnung dienen etwa <p>...</p> oder <em>...</em> . Die meisten der Präsentations-Elemente und -Attribute in der HTML4-Spezifikation als missbilligt (engl. deprecated ) markiert. <H1>Dies ist eine Überschrift</H1>

In XHTML wurden einige Elemente geändert sie der XML-Syntax entsprechen. Dies betrifft alle Elemente also solche die keinen Text umschließen Beispielsweise br oder hr . Diese werden nach den Regeln der geschrieben als <br/> beziehungsweise <hr/> . Da einige ältere Browser jedoch Probleme dieser Darstellung haben sollte zur besseren Abwärtskompatibilität zusätzliches Leerzeichen eingefügt und das Element wie geschrieben werden: <br /> . Außerdem sind alle Element-Bezeichner sowie Attribut-Bezeichner zu schreiben. Leeren Attributen (z.B. nowrap ) muss ein Wert zugewiesen werden (z. nowrap="nowrap" ). Text muss immer durch Elemente beschrieben und darf nicht lose zwischen den body-Start- und -End-Tags stehen.

HTML-Struktur

Allgemeine Struktur

Ein HTML-Dokument besteht aus drei Bereichen:

  1. der Doctype-Deklaration ganz am Anfang der Datei die verwendete DTD angibt z. B. „HTML 4.01 Strict“
  2. dem HTML-Kopf der hauptsächlich technische oder Informationen enthält die nicht direkt im Browser sind und
  3. dem HTML-Körper der anzuzeigende Informationen enthält.

Somit sieht die Grundstruktur einer Webseite folgt aus:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
    " http://www.w3.org/TR/html4/strict.dtd ">
<html>
<head>
<title>
Titel der Webseite </title>
Evtl. weitere Kopfinformationen
</head>
<body>

Inhalt der Webseite
</body>
</html>



HTML-Kopf

Im Kopf können 6 verschiedene Elemente werden:

  1. title bezeichnet den Titel der Seite der Browserfenster sowie oft in Suchmaschinen angezeigt wird
  2. meta enthält so genannte Metaangaben (Metatags) und weitreichend parametrisierbar
  3. base gibt entweder eine Basis- URI an oder einen Basis frame und
  4. link dient zur Angabe von logischen Beziehungen anderen Ressourcen. Am häufigsten zur Einbindung von Stylesheets benutzt.
  5. script bindet Code in einer bestimmten Skriptsprache ein hauptsächlich JavaScript .
  6. style beinhaltet CSS -Regeln direkt im Dokument.

HTML-Körper

Eine Hauptüberschrift wird so ausgezeichnet:

<h1>Hauptüberschrift</h1>

h1 steht für Heading 1 .

Diese Auszeichnung wird nun als Hauptüberschrift Weiter möglich sind h2 bis h6 Überschriften zweiter bis sechster Ordnung mit sich die Gliederung einer Seite verdeutlichen lässt. Präsentation dieser Überschriften ist von ihrer strukturierenden unabhängig und kann mit CSS beeinflusst werden. keinen Fall sollte man die Überschrift-Elemente zur von Text missbrauchen. Suchmaschinen-Roboter messen Überschriften eine Relevanz zu als normalem Fließtext.

Hyperlinks:

<a href="http://www.example.com/">Gehe zu example.com</a>

Hier wird auf die Ressource http://www.example.com/ verwiesen. Der Text Gehe zu example.com wird dabei als Link dargestellt.

Die logische Beschreibung der Struktur des vereinfacht es zum Beispiel dass der Text einem Sehbehinderten vorgelesen oder als Brailleschrift ausgegeben werden kann. Auch für Suchmaschinen das von Vorteil um HTML-Dateien möglichst sinnentnehmend

Zur Logik stehen zum Beispiel die strong und em bereit mit denen sich stark hervorgehobener betonter Text auszeichnen lässt. Zur visuellen Kenntlichmachung sich die Verwendung der beiden CSS -Regeln

strong { font-weight: bold }
em { font-style: italic }

die für den Inhalt von strong -Elementen und em -Elementen die Präsentation in Fettschrift bzw. Kursiv-Schrift empfehlen.

DTD-Varianten

Beim Entwurf der letzten HTML-Version 4 der Tatsache dass in viele Webdokumenten noch Elemente und Attribute eingesetzt werden Rechnung getragen auch eine stilistisch saubere DTD angeboten werden. Das Ergebnis waren schließlich Varianten:

Strict

Diese DTD-Variante war ursprünglich vorgesehen wurde zugunsten der Abwärtskompatibilität fallen gelassen. Es fehlen meisten Elemente und Attribute zur Beeinflussung der (Auszeichnungselemente) und die Syntax muss wohlgeformt sein. bedeutet dass jedes öffnende Element (Tag) ein Element besitzen muss die Elementreihenfolge muss beachtet und Text muss sich grundsätzlich in einem befinden. Beispielsweise ist Text der sich frei den body-Elementen befindet nicht mehr erlaubt. Diese waren für die Angleichung an XML notwendig bilden die Grundlage für XHTML.

Transitional

Die Variante die noch ältere Elemente Attribute enthält die auch physisches Markup ermöglichen. diese DTD soll auch Webautoren die noch auf Trennung von Textauszeichnung und Präsentation umgestellt die Möglichkeit gegeben werden standardkonformes HTML zu und soll sicherstellen dass bestehende nicht standardkonforme weitherhin durch aktuelle Webbrowser angezeigt werden können.

Frameset

Diese Variante enthält zusätzlich zu allen der Transitional-Variante noch die Elemente für die von Framesets. Bei der Verwendung sollte man aber an der Strict-Variante orientieren.

Falsche Interpretation von Webdokumenten

Selbige war und ist ein Ärgernis Webautoren. Auch wenn man standardkonformes HTML schreibt noch lange nicht gewährleistet dass die entstandenen in den gängigen grafischen Webbrowsern richtig dargestellt Hierbei ist zwar zu beachten dass eine von HTML-Dokumenten an die Gegebenheiten auf der durchaus von Vorteil und auch gewollt ist häufig kommt es auch zu wirklichen Falsch-Interpretationen. die ausschließliche und wohlüberlegte Verwendung von strukturierendem logischem HTML kann in gewisser Hinsicht gewährleistet dass ein Webdokument unter allen Umständen wenigstens und nutzbar ist.

Wer aber auf eine bestimmte Präsentation Inhalte Wert legt wird finden dass es noch an der CSS-Interpretation scheitert. Gerade der weitesten verbreitete Webbrowser der ( Internet Explorer ) ist zwar sehr gutmütig und lässt manchen Fehler durchgehen hat aber in CSS-Belangen Defizite welchen Rechnung zu tragen ist. Die aus der Gecko-Engine ( Mozilla Mozilla Firefox Netscape ...) der KHTML-Engine ( Konqueror Safari ) sowie aus dem Hause Opera haben hier am wenigsten Probleme sind auch weniger fehlertolerant.

Wenn einem Webautor also wichtig ist Webdokumente zumindest in den gängigen grafischen Webbrowsern dargestellt werden kommt er nicht umhin seine in diesen ausgiebig zu testen.

Sprachtyp

Im Gegensatz zu Java oder C ist HTML keine Programmiersprache auch wenn die Mehrheit der Webbenutzer dies annimmt. HTML ist wegen fehlender Elemente Wenn-Dann-Bedingungen Variablen etc. keine Programmiersprache und HTML auch keine Seitenbeschreibungssprache wie etwa Postscript weil eben keine Seiten beschrieben werden Text strukturell und logisch ausgezeichnet wird. Daher HTML eine Auszeichnungssprache und wird als solche auch nicht programmiert ge script et ge code t oder gar geproggt. HTML wird schlicht geschrieben .

Ein ähnliches Konzept (logische Beschreibung) wie HTML steht auch hinter dem Satzsystem TeX/ LaTeX das im Unterschied zu HTML jedoch die Ausgabe per Drucker auf Papier zielt.

  

Weiterentwicklungen

Im Laufe der Jahre ist HTML Elemente erweitert worden die sich (fast nur) der Gestaltung des Dokuments befassen was der Idee der Systemunabhänigkeit entgegen lief.

Dazu gehören die Möglichkeiten Seiten dynamisch verändern z. B. mittels JavaScript . Man spricht dann von DHTML (Dynamic HTML). Da diese Möglichkeiten von Browser-Herstellern (allen voran Microsoft und Netscape) entwickelt gibt es erhebliche Probleme mit der Interpretation der Elemente zwischen den verschiedenen Browsern.

Eine Rückbesinnung auf die Trennung von ( Struktur ) und Layout wurde durch die Definition der Cascading Sheets ( CSS ) vorgenommen. So soll das Aussehen des in einer separaten Datei (dem sog. Style festgelegt werden. Dies ermöglicht es viel besser Layout an das Ausgabegerät (oder spezielle Bedürfnisse von Sehbehinderten) anzupassen. Diese Vorgabe wird allerdings konsequent umgesetzt.

Als zukünftiges universelles Format wird zunehmend XML (eXtensible Markup Langugage) ein selbstbeschreibendes Datenmodell eingesetzt. Dieses arbeitet ebenfalls mit Tags jedoch per DTD (Document Type Definition) sehr restriktiv eingesetzt können. Zur Umwandlung von in XML gehaltenen in die entsprechenden „Anzeigeformate“ kann XSL verwendet werden eine Style Sheet Sprache Transformation z.B. nach XHTML.

HTML lernen

SELFHTML ist ein deutschsprachiges und sehr umfangreiches das für viele Themen rund um HTML bietet.

Die Lektüre einer modernen linearen Einführung Weblinks) und die Handarbeit direkt in einem ist empfehlenswert um HTML richtig zu verstehen voll auszunutzen.

Für schnelle Arbeiten mag die Arbeit einem grafischen (so genannten WYSIWYG -Editor) zunächst genügen allerdings produzieren diese Editoren einen HTML-Code der die optischen Vorstellungen widerspiegelt. und logische Informationen die dem Text erst echten Mehrwert geben lassen sich nur einsetzen man HTML hinreichend gut verstanden hat. Hinzu dass diese Editoren gelegentlich ungültiges HTML produzieren die Darstellung des Dokuments von der Ratekunst Webbrowsers abhängig macht. Professionelle Webgestalter verwenden visuelle daher häufig nur um das Grundgerüst von zu erstellen und optimieren den Code danach

Referenz-Literatur

Weblinks


Siehe auch: DHTML JavaScript CSS ) MHTML (MIME HTML) HTML- Webtemplates



Bücher zum Thema Hypertext Markup Language

Dieser Artikel von Wikipedia unterliegt der GNU FDL.

ImpressumLesezeichen setzenSeite versendenSeite drucken

HTML-Code zum Verweis auf diese Seite:
<a href="http://www.uni-protokolle.de/Lexikon/HTML.html">Hypertext Markup Language </a>