Mobile-Menu

Grundlagen moderner Netzwerktechnologien im Überblick – Teil 92

Die Internet-Protokolle im Überblick – E-Mail, FTP, WWW, HTML und HTTP

Seite: 3/3

Anbieter zum Thema

HTML und HTTP

WWW basiert auf den drei Standards HTML (Hypertext Markup Language), HTTP (Hypertext Transport Protokoll) und URL (Uniform Resource Locator). HTML spezifiziert die Form eines Dokumentes, HTTP ist das Protokoll zur Übertragung von HTML-Hypertextdokumenten und URL ist das bereits besprochene Adressierungsschema.

Die Arbeitsweise von WWW ist nach dem Client/Server-Prinzip organisiert, die Menge der Browser auf den WWW-Clients greift auf die Informationen zu, die durch die Menge der WWW-Server bereitgestellt wird. Durch die hohe Beliebtheit und Verbreitung von WWW ist es notwendig geworden, als Server recht leistungsfähige Maschinen zu verwenden, denn das Konzept des WWW ist zum Scheitern verurteilt, wenn der Link zu einer anderen Information zu lange auf sich warten lässt oder in vielen Fällen gar nicht zustande kommt. Mittlerweile gibt es Erweiterungen des WWW Grundkonzeptes, z.B. mit einem Format für dreidimensionale graphische Darstellungen VRML oder Java. Außerdem können WWW-Clients auch auf Leistungen von FTP und anderen Internet-Diensten zugreifen.

Die Hypertextdokumente werden in HTML beschrieben, weil sich eine Formalisierung durch eine Rumpf-Programmiersprache für diesen Zweck geradezu anbietet. Ein Dokument hat in der Regel Verweise auf weitere Dokumente auf dem eigenen oder fremden Servern.

HTTP ist das Kommunikationsprotokoll zwischen WWW-Clients und WWW-Servern. Aus den oben genannten Gründen ist es auf seiner Schicht nicht verbindungsorientiert. Wenn ein Client die durch einen URL bezeichneten Daten von einem Server haben will, baut er zu diesem Server eine TCP/IP-Verbindung auf. Normalerweise benutzt er dazu den Port 80. Über diese Verbindung schickt er den HTTP-Request. Dieser Request ist ein einfacher Befehl, der im Wesentlichen die Zugriffsmethode, den Identifier und die benutzte HTTP-Version enthält. Der Server sucht die Daten heraus, schickt sie über die TCP/IP-Verbindung zurück und baut die TCP/IP-Verbindung von seiner Seite aus ab, wenn er fertig ist. Das war’s.

Für den HTTP-Request hätte man eigentlich nur UDP als Protokoll der Schicht 4 gebraucht. Da man aber bei der Antwort auf die Frage des Clients üblicherweise mehr Daten zu übertragen hat, als in ein Paket gehen, hat man sich doch für das verbindungsorientierte und zuverlässige TCP/IP auf dieser Schicht entschieden. Der große Vorteil von HTTP ist, dass der Server nicht damit belastet wird, viele Verbindungen über eine längere Zeit halten zu müssen. Ein beliebter Server hat dazu auch viel zu viele Anfragen zu bearbeiten.

Dieser Nichtdeterminismus führt dazu, dass man keine wirklichen Vorhersagen über die benötigte Bandbreite in Intranets machen kann. Es ist daher günstig, in dieser Hinsicht flexible LAN-Techniken wie die Ethernet-Familie bis hin zum Switched Gigabit Ethernet im Zusammenhang mit einer strukturierten, leistungsfähigen Verkabelung einzusetzen. Dann ist man vor Überraschungen weitestgehend sicher.

Eine wesentliche Schwäche von HTTP sind die Sicherheitsmängel. Dazu kommen wir aber in einem anderen Artikel.