Krisen- und Prozessmanagement bei Störungen der IT

IT-Ausfall: Wüssten Sie, was zu tun ist?

| Autor / Redakteur: Sandra Effenberger/Bernhard Lück / Andreas Donner

Die Notfallplanung muss nicht nur eine systematische Wiederherstellung des Betriebs und der Daten gewährleisten, sondern auch verhindern, dass Notfälle überhaupt entstehen können.
Die Notfallplanung muss nicht nur eine systematische Wiederherstellung des Betriebs und der Daten gewährleisten, sondern auch verhindern, dass Notfälle überhaupt entstehen können. (Bild: MIT Solutions)

Bei Störungen oder einem Komplettausfall der IT lautet das Gebot der Stunde, die Geschäftskontinuität wiederherzustellen, betriebswirtschaftliche Schäden zu reduzieren und die Existenz des Unternehmens auch bei einem größeren Schadensereignis zu sichern.

Früher oder später machen die meisten Unternehmen unliebsame Erfahrungen mit Datenverlusten, Störungen von Kern- oder Subsystemen und ähnlichen IT-Notfallszenarien – ob direkt oder indirekt. Die komplexen Strukturen unserer globalen Kollaborationsnetzwerke, Lieferketten und ineinandergreifenden Produktionsprozesse (Stichwort: „Just-in-Time“) machen uns in hohem Maße abhängig von einem kontinuierlichen, störungsfreien Geschäftsbetrieb zwischen allen Prozessbeteiligten. Maßnahmen zur Sicherung der IT-Betriebsbereitschaft und die Etablierung eines Notfallmanagements bzw. Disaster-Recovery-Konzeptes sind daher heute wichtiger denn je.

Jochen Möller ist Geschäftsführer der Hamburger MIT Solutions GmbH.
Jochen Möller ist Geschäftsführer der Hamburger MIT Solutions GmbH. (Bild: MIT Solutions)

„Dennoch hat im Schnitt jedes zweite Unternehmen in Deutschland für Störfälle in der IT keine adäquate Notfallplanung parat, um negative Auswirkungen auf den laufenden Geschäftsbetrieb zu vermeiden oder zu minimieren. Ein Grund dafür liegt u.a. darin, dass die Verantwortlichkeiten für die Initiierung einer IT-Notfallplanung im Unternehmen nicht immer klar geregelt sind. Leider wird dieses Thema daher häufig erst dann mit dem notwendigen Engagement vorangetrieben, wenn das Kind schon in den Brunnen gefallen ist. Im Ernstfall fehlt es dann jedoch an dem methodischen Know-how, sodass oftmals keine strukturierte Herangehensweise mehr möglich ist – die Folge sind unproduktive Mehrzeiten und Umsatzeinbußen“, weiß IT-Service-Management-Spezialist Jochen Möller, Geschäftsführer der Hamburger MIT Solutions GmbH.

Checkliste für den Ernstfall

Um auf einen IT-Notfall angemessen zu reagieren, benötigen Unternehmen eine strukturierte IT-Notfallkonzeption, die verschiedene Eventualitäten bereits im Vorfeld beleuchtet. Bei Eintritt einer Notfallsituation in der IT-Umgebung beschreibt sie die Vorgehensweise, wie in einer angemessenen Zeit zum einen der Notfallbetrieb und zum anderen die vollständige Verfügbarkeit der IT und der Daten sichergestellt werden kann. „Orientierung gibt hier der IT-Service-Continuity-Management-Standard (ITSCM) nach ITIL 2011, der als vierstufiger Leitfaden zur Behebung von „Major Incidents“ und zur Realisierung einer gezielten Wiederherstellungsplanung von IT-Services verfasst wurde. Um Unternehmen bei der zuverlässigen IT-Notfallplanung zu unterstützen und die ITSCM-Maßnahmen unter Berücksichtigung individueller Strukturen erfolgreich umzusetzen, hat MIT Solutions für den IT-Notfall ein ganzheitliches Best-Practice-Modell entwickelt. Dieses umfasst sowohl die Identifikation relevanter IT-Services und Konzeptionierung der Notfallprozessplanung als auch die Einrichtung eines Notfall-Desks und Informationsbereitstellung für den Wirtschaftsprüfer. Am Ende erhält das Unternehmen eine vollständige, softwaregestützte Dokumentation mit allen relevanten Informationen an die Hand, sodass die notwendigen Schritte zur Wiederherstellung der IT wie eine Checkliste abzuarbeiten sind“, erklärt Jochen Möller.

Entwicklung eines Notfallplans

Ein Notfall entsteht zumeist durch eine Verkettung von einzelnen Störungen, die jeweils für sich genommen nicht kritisch gewesen wären. Die Notfallplanung erfüllt daher nicht nur den Zweck, eine systematische Wiederherstellung des Betriebs und der Daten zu gewährleisten, sondern auch Risiken präventiv zu managen und zu verhindern, dass Notfälle überhaupt entstehen können. Am Anfang des Planungsprozesses bei MIT Solutions steht daher eine Risikobetrachtung (Business-Impact-Betrachtung). Die Identifikation, Analyse sowie die Bewertung und Dokumentation der Risiken in Bezug auf Eintrittswahrscheinlichkeit und Auswirkungen stellen dabei die Basis für die weiteren Notfallpläne dar. Daraus lassen sich sowohl die kritischen Ausfallzeiten, quasi die „Überlebensdauer“ des Unternehmens im Hinblick auf bestehende Verträge und SLAs, als auch Schwachstellen auf Prozessebene, IT-Risiken und geeignete Gegenmaßnahmen ermitteln.

In dieser Analysephase wird ebenfalls definiert, welche Systeme für die Leistungserbringung des Unternehmens als kritisch einzustufen sind, wie diese zusammenspielen und welche Bedingungen zur Auslösung bestimmter Workflows gegeben sein müssen. Auf dieser Grundlage wird schließlich festgelegt, wann eine Störung zu einem Notfall bzw. wann ein Notfall zu einer Krise wird sowie welche Kommunikationswege und Abläufe zur Wiederherstellung zu initiieren sind. Im Anschluss folgt die Ausgestaltung der Notfallprozessplanung und Wiederanlaufplanung zur Beseitigung der Störung. Anhand einer „Notfall-Checkliste“ kann der verantwortliche Mitarbeiter die Einhaltung sämtlicher Prozessschritte von A bis Z überwachen.

Faktor Mensch – Sicherheit durch Training und Tests

Störfälle treten im Unternehmensalltag immer wieder zutage. Wichtig dabei ist, dass aus den Störfällen keine Krisen entstehen. Beim Umgang mit kritischen Situationen sind daher auch psychologische Komponenten auf Mitarbeiterebene und der Faktor „Mensch“ zu beachten. Der arbeitsorganisatorischen Vorbereitung und Übung von Notfallszenarien kommt daher eine große Bedeutung zu, um alle Beteiligten mit den jeweiligen Aufgaben im Krisenfall vertraut zu machen und das Zusammenspiel aller Akteure und Prozesse zu trainieren. Mithilfe von Reviews können Schwachstellen identifiziert und die Testkonzepte bzw. Ablaufpläne in einem iterativen Prozess stetig verbessert werden.

Krisen-, Prozess- und IT-Service-Management integriert abwickeln

„In einer Notfallsituation müssen alle Rädchen ineinandergreifen und alle Beteiligten müssen schnell reagieren. Wer übernimmt welche Aufgaben? Wer ist zu benachrichtigen und wer hat welche Entscheidungsbefugnisse? Welche Dokumentationen sind vorhanden und wo sind diese hinterlegt? Welche Systeme müssen zuerst wiederhergestellt werden? Welche Fristen sind unbedingt einzuhalten? Wie erreiche ich verantwortliche Systemspezialisten und welche Vertreterregelungen gibt es? Die Mitarbeiter müssen die anfallenden Fragen nicht nur ad hoc beantworten können, sondern müssen durch diesen Prozess effektiv geleitet werden, da Menschen in Extremsituationen anders „funktionieren“. Ein zentrales Element des Notfallmanagements ist daher neben regelmäßigen Übungsszenarios die Softwareunterstützung der Notfallprozesse“, so Jochen Möller.

Mit der prozessorientierten IT-Service-Management-Suite Echolon liefert MIT Solutions ein Werkzeug für das Zusammenspiel von Krisen-, Prozess- und Service-Management. Die Lösung gewährleistet als zentrales Element der Notfallplanung die automatisierte Steuerung sämtlicher Abläufe bis zur Systemwiederherstellung. Mitarbeiter werden so auf effektive Weise eingebunden, über Alerts in Kenntnis gesetzt und an Aktivitäten erinnert. Jeder prozessbeteiligte Mitarbeiter ist somit über den aktuellen Stand der Maßnahmen informiert und weiß, welche Schritte als nächstes zu tun sind. Die erforderlichen IT-Services für den Notbetrieb, wie etwa notwendige Sofortmaßnahmen, die Systembetreuung im Notbetrieb, die Wiederherstellung der Infrastruktur und schließlich die Rückkehr zum Normalbetrieb, werden dabei durch Echolon implementiert und bereitgestellt. Sämtliche Hardware, Workflows und Process-Owner können dabei direkt im System verwaltet und gepflegt werden. Im Ausfallszenario sind Unternehmen so in der Lage, dynamische Prozesse und aktuelle Informationen mit einer automatischen Eskalationsroutine effektiv zu verbinden. Bereits im Standard bietet Echolon eine Vielzahl von Notfallprozessvorlagen, die an die Vorgaben des ITSCM nach ITIL angelehnt sind.

Über die Autorin

Sandra Effenberger ist Projektleiterin bei der MIT Solutions GmbH.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 42751241 / Disaster-Recovery-Planung)