Zero Downtime und Ausfallsicherheit im Fokus

High-Availability-Konzepte und Szenarien in der Praxis

| Autor / Redakteur: Marita Schultz / Andreas Donner

IT-Gretchenfrage: wann muss ein System rund um die Uhr mit höchster Sicherheit verfügbar sein und wann sind kurze Totzeiten akzeptabel?
IT-Gretchenfrage: wann muss ein System rund um die Uhr mit höchster Sicherheit verfügbar sein und wann sind kurze Totzeiten akzeptabel? (Bild: Consol)

Zero Downtime und High Availability sind für viele Firmen und Industriezweige unternehmenskritisch. Allerdings gibt es dafür kein allgemeingültiges Konzept. Zu verschieden sind die Anforderungen. Doch welche Herangehensweise und Technologie eignet sich für welches Unternehmen und welche Anforderungen?

Zunächst einmal gilt: Für fast alle Firmen ist der unterbrechungsfreie Betrieb ihrer komplexen IT-Landschaft in irgendeiner Form unternehmenskritisch. Ausfälle und Störungen können fatale Folgen für Umsatz, Image und den Erfolg des Unternehmens haben. Besonders in solchen Unternehmen, in denen Kunden, Lieferanten und Partner jederzeit auf die Unternehmens-IT zugreifen müssen und in denen hoch komplexe Produktionssysteme laufen sowie logistische Abläufe ineinander greifen.

Bei den Themen Hochverfügbarkeit und Ausfallsicherheit – das weiß der IT-Full-Service-Anbieter Consol aus vielen Erfahrungen – stehen Firmen im Spannungsfeld zwischen dem Wunsch nach 100-prozentiger Ausfallsicherheit (Zero Downtime) und begrenzten IT-Budgets. Es bedarf individueller Analysen der Systeme, der darauf abgebildeten Geschäftslogik sowie der vorhandenen Organisation, Stichwort Change Management, um das geeignete Konzept für jedes Unternehmen individuell zu ermitteln.

In der Praxis hat sich eine grobe Dreiteilung der Hochverfügbarkeitsstufen bewährt:

  • Die „manuelle“ Hochverfügbarkeit, bei der ein Restart manuell angestoßen werden muss. Eine Unterbrechung des laufenden Betriebs ist spürbar, aber nicht geschäftsschädigend.
  • Die „normale“ Hochverfügbarkeit, bei der eine kurze Unterbrechung zu spüren ist, die jedoch automatisch durch einen Restart wieder behoben wird.
  • Die „unterbrechungsfreie“ Hochverfügbarkeit (Zero Downtime), bei der ein Anwender einen kurzzeitigen Ausfall nicht bemerkt, da das System von einem anderen übernommen wird.

„Die Risikobewertung sollte immer am Anfang eines Projekts in Richtung Hochverfügbarkeit stehen“, erläutert Henning von Kielpinski, Manager Virtualisierung bei Consol. „Die technische Lösung kommt erst danach. Dabei gilt pauschal: Je kritischer und individueller die Informationen und Prozesse und je vernetzter die Systeme, desto mehr ist auf die Absicherung des unterbrechungsfreien Betriebs zu achten.“

Im Folgenden werden einige Konzepte für Hochverfügbarkeit vorgestellt, die sich in der Praxis relativ häufig finden.

Web-Applikationen – Konzept: Clustering

Versicherungen, Banken und Finanzdienstleister zum Beispiel stellen ihren Mitarbeitern in Filialen oder im Außendienst komplexe Web-Portale zur Verfügung, über die sie Kunden neu aufnehmen, Verträge abschließen, Konten eröffnen können und vieles mehr. Der Zugriff für die Mitarbeiter über das Web ist dabei bequem und komfortabel.

Ergänzendes zum Thema
 
Tipps helfen für die Risikobewertung

Im Backend agiert oftmals eine Vielzahl an Web-Application-Servern und Datenbanken mit vielen Millionen Datensätzen. Wenn es dann beim Ausfüllen eines Formulars plötzlich „hakt“, heißt es, das System sei heute wieder besonders langsam. Solche kurzen Ausfälle strapazieren zwar manchmal die Nerven der Mitarbeiter (und Kunden), haben jedoch keine sofortigen negativen Auswirkungen; allein entsteht für den Kunden eine minimal längere Wartezeit.

Eine „normale“ Hochverfügbarkeit von 99,9 Prozent ist hier also ausreichend. Diese kann zum Beispiel über das klassische Clustering erreicht werden, bei dem die Anwendungen auf zwei Clustern laufen und bei Ausfall eines Knotens das zweite Cluster übernimmt.

Kundenportale – Konzept: User-basiertes Routing und reverse Proxy

Etwas anders als bei den internen Portalen sieht es bei Kundenportalen aus, über die sich Kunden registrieren, anmelden, Produkte oder Dienstleistungen kaufen, ihre Konten verwalten und vieles mehr.

Solche umfangreichen Kundenportale stellen zum Beispiel Telekommunikationsanbieter zur Verfügung. Bestehende Kunden haben ihren eigenen Bereich mit einer Schnittstelle zur Buchhaltung für die Rechnungsstellung und den Kundendaten. Zudem sind einige dieser Kundenportale auch in die Web-2.0-Strategien der Anbieter eingebunden und stellen die Schnittstelle zum Service dar.

Ein Ausfall bedeutet nicht nur einen hohen Imageschaden und Unzufriedenheit der Kunden, sondern auch finanzielle Verluste. Aus diesem Grund empfehlen sich hierfür Zero Downtime-Konzepte oder –Services. Die Ausfallsicherheit der Application-Server-Instanzen lässt sich dabei softwareseitig zum Beispiel durch die Implementierung einer speziellen User-basierten Routinglösung und der Verwendung eines reverse Proxies sicherstellen.

E-Mail-Verfügbarkeit und Konsistenz der Informationen – Konzept: DNS und IP Round Robin

Nahezu alle Unternehmen wickeln einen Großteil ihres Geschäftes über den E-Mail-Verkehr ab. Die darin enthaltenen Informationen sind vielfach geschäftsrelevant, z.B. befinden sich darunter auch Aufträge, Bestellungen, Lieferantenverträge, Absprachen und vieles mehr. Nicht selten verzeichnen solche Firmen einen täglichen Mail-Durchsatz von mehreren Millionen E-Mails mit Größenordnungen von mehreren Hundert Gigabyte.

Eine Unterbrechung oder der Verlust einer E-Mail mit wichtigen Informationen wäre produktions- und geschäftsschädigend. Aus diesem Grund muss neben der Hochverfügbarkeit auch die Konsistenz der Informationen gewährleistet sein. Das System muss also zu jedem Zeitpunkt wissen, in welchem Status es sich befindet und befunden hat. Eine unterbrechungsfreie Hochverfügbarkeit lässt sich hier zum Beispiel auf Basis des DNS (Domain Name System) mit dem Verfahren IP Round Robin realisieren.

Web-Applikationslandschaften mit Anschluss an Produktionssysteme – Konzept: Clustering mit Load Balancing

Sind an eine komplexe Web-Applikationslandschaft auch produktionsrelevante Prozesse angeschlossen, benötigen Firmen Zero-Downtime-Konzepte, also eine 100-prozentige Ausfallsicherheit.

Dies kommt zum Beispiel bei Automobilherstellern relativ häufig vor, aber auch andere Industriezweige nutzen diese Möglichkeiten. Sie steuern sowohl ihre Außendarstellung als auch die internen oder produktionsrelevanten Prozesse wie das Bestellwesen mit Zulieferern über eine solche Web-Applikationslandschaft. Um einen Ausfall mit einem möglichen Datenverlust zu vermeiden, müssen sich alle Systeme permanent synchronisieren, damit beim Ausfall eines Systems ein anderes auf dem gleichen Informationsstand ist und eine Anfrage im aktuellen Status übernehmen kann.

Durch das Verteilen der kompletten Web- und Applikationsserverlandschaft auf geclusterte, aktive und passive Server mit vorgeschalteten Load Balancern kann hier eine hundertprozentige Ausfallsicherheit und Hochverfügbarkeit erreicht werden.

Fazit

Die Praxisbeispiele zeigen, wie unterschiedlich die Anforderungsprofile an Hochverfügbarkeit und Ausfallsicherheit sein können. Um schließlich eine passende und bezahlbare Lösung zu finden, sollte ein Unternehmen zunächst genau analysieren, welches die wohl kritischsten Anwendungen sind und wie hoch das Risiko ist, sollte ein solches System für kurz oder lang ausfallen. In der Praxis zeigt sich oftmals, dass sich nicht alle Risiken gleichermaßen absichern lassen können und auch nicht müssen.

Kommentar zu diesem Artikel

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 42557568 / Hochverfügbarkeit und Business Continuity)