Betriebs- und Ausfallsicherheit objektiv bewerten

Der Elchtest für das Rechenzentrum

| Autor / Redakteur: Rolf Walter / Susanne Ehneß / Andreas Donner

Die Ausfall- und Betriebssicherheit von Rechenzentren beruht auf zahlreichen Aspekten. Regel­mäßige detaillierte Testdurchläufe tragen dazu bei, die Verfügbarkeit zu verbessern
Die Ausfall- und Betriebssicherheit von Rechenzentren beruht auf zahlreichen Aspekten. Regel­mäßige detaillierte Testdurchläufe tragen dazu bei, die Verfügbarkeit zu verbessern (© Kadmy - stock.adobe.com)

Wegen Problemen mit der Kältetechnik des Rechenzentrums ­drohte vor einigen Jahren in der Leitzentrale der Berliner Polizei der Ausfall­ der Notrufnummer. Keine Konnektivität bedeutet: keine Services und unzufriedene Kunden bis unversorgte Bürger. Rolf Walter, ­Leiter des Teams Data Center Services beim TÜV Rheinland, erläutert den „Elchtest“ für Data Center.

Die Digitalisierung von Geschäftsprozessen schreitet rasant voran, auch und gerade in der Verwaltung. Im Internet der Dinge und in Zeiten fortschreitenden eGovernments ist die Verfügbarkeit von Servern und Rechenzentren einer der zentralen Erfolgsfaktoren für eine Kommune oder kommunale Körperschaft. Um die Betriebs­sicherheit und Ausfallsicherheit von Rechenzentren objektiv zu bewerten, haben die Experten von TÜV Rheinland einen eigenen Anforderungsstandard entwickelt.

Kriterien

Der Kriterienkatalog, der insbesondere auf der „Rechenzentrums-Norm“ DIN EN 50600 sowie auf eigenen Best-Practice-Erfahrungen und den wichtigsten internationalen Richtlinien und Standards basiert, umfasst eine Betrachtung zur physikalischen Infrastruktur, mit der sich die Sicherheit und Verfügbarkeit in fünf verschiedenen ­Kategorien analysieren lässt.

Zu den allgemeinen Grundlagen, die der TÜV Rheinland näher analysiert, zählen Kundendaten, Verfügbarkeitsanforderungen, Gefährdungsanalyse (Risk Management) und das Sicherheitskonzept. Im Bereich Baukonstruktion sind ­unter anderem Umfeld und Standort, Gebäudekonstruktion sowie Ausbau und Layout und das IT-Flächen­design relevant. In der ­Kategorie Technik spielen Aspekte wie die Brandmelde- und Löschanlage sowie Zutrittssicherheit ­eine Rolle, außerdem die Gebäudeleittechnik, eine unterbrechungsfreie Stromversorgung, die Klimaversorgung sowie IT- und Netzverkabelung und Doppelboden.

Ebenfalls von Bedeutung sind Faktoren der allgemeinen Organisation. Gibt es zum Beispiel ein Betriebshandbuch, wie gestalten sich die Organisationsabläufe, wie sind Logistik und Transport geregelt, gibt es regelmäßige Abnahmen und Funktionstests? Wie werden Mitarbeiter eingewiesen?

In puncto Betrieb spielen unter anderem Fragen in Bezug auf Wartung und Service sowie Ausbildung, Schulung, Qualifikation und Notfallübungen eine wichtige Rolle.

Ergänzendes zum Thema
 
Analyse von Sicherheit und Verfügbarkeit der IT-Infrastruktur nach TÜV Rheinland

Der Auditprozess ist auf den individuellen Schutzbedarf der Organisation abgestimmt. Das Team Data Center Services vom TÜV Rheinland hat seit seinem Bestehen zahlreiche Unternehmen unterschiedlichster Branchen und Betreiber von Rechenzentren auditiert. Daneben haben die Experten auch bestehende Rechenzentren und Serverräume bereits auf Herz und Nieren geprüft.

Die spannendsten Anforderungen stellen in der Regel Integrationstests der Energie- Kälte- und Sicherheitstechnik dar. Mit diesen auch als „Elchtests für Rechenzentren“ bezeichneten Testabläufen wird die Technik von Rechenzentren auf Herz und Nieren geprüft.

Ohne diese Tests kann der Betreiber nicht sicher sein, dass das ­Rechenzentrum an sich auch bei Störumschaltungen sicher funktioniert. Das aber fordern zahlreiche Normen. In vielen Projekten, die der TÜV Rheinland als Data Center Service qualitätssichernd begleitet, sind Integrationstests eine Voraussetzung für eine finale Abnahme durch den Bauherrn.

Internationale Richtlinien und Standards

Die Integrationstests legen nach der Inbetriebnahme offen, ob die hochkomplexe technische Gebäudeausrüstung zuverlässig funktioniert – eine zentrale Voraussetzung für die Abnahme von neu errichteten Rechenzentren. Der „Elchtest“ vom TÜV Rheinland simuliert verschiedene Störungen und Umschaltszenarien und nimmt währenddessen die betroffenen Komponenten aus Elektrotechnik, Kälteversorgung und Sicherheitstechnik ins Visier.

Zum Beispiel mit dem „Black Building“-Test, bei dem die Hauptstromzufuhr unterbrochen wird. Läuft der Notstrom automatisch an? Werden die Schaltvorgänge fehlerfrei übernommen? Und wechselt das System zurück in den Normalbetrieb, sobald der Hauptstrom wieder verfügbar ist? Lautet die Antwort auf eine dieser ­Fragen „nein“, besteht Handlungsbedarf.

Ein weiterer Test: Fällt eine von zwei redundanten Klimaanlagen aus, muss die andere die vorgegebene Temperatur allein halten ­können. Schafft sie das nicht, gilt es dringend nachzubessern.

Mit dem „Elchtest“ können frühzeitig Fehler im Rechenzentrum aufgedeckt werden, die bei einer herkömmlichen Inbetriebnahme unter Umständen verborgen bleiben und die sich später massiv auf den regulären Betrieb auswirken könnten.

Willkommener Nebeneffekt: Das Personal des Rechenzentrum-­Betreibers erhält ein effektives Training on the Job und kann seine Anlagenkenntnisse enorm erweitern. Letztlich tragen die Tests vom TÜV Rheinland also entscheidend dazu bei, mögliche Ausfallzeiten zu reduzieren und die Verfügbarkeit zu verbessern – und ­damit die Zukunftsfähigkeit der Organisation zu sichern.

Handlungsbedarf ­erkennen

Es gibt einige Indikatoren, die Handlungsbedarf im Bereich Betriebssicherheit von Rechenzen­tren aufzeigen können. Hier ein kleiner Fragenkatalog für den Quick-Check:

  • Sind eventuelle Risiken im Rechenzentrum klar definiert?
  • Testen Sie regelmäßig eine Lastübernahme durch den Generator?
  • Gab es in der Vergangenheit eventuelle Störfälle, deren Hergang und Ursache sich nicht ­eindeutig klären ließen?
  • Existieren Verfahrensanwei­sungen für Störfälle und werden diese regelmäßig geübt?
  • Sind den Verantwortlichen die Inhalte von Wartungsverträgen rund um das Rechenzentrum klar?
  • Gibt es ein Monitoring darüber, welche Geräte wann den End-of-Life-Status (EOL) erreicht haben?
  • Ist dem RZ-Verantwortlichen bewusst, durch welche Maßnahmen sich Energie einsparen lässt?
  • Ist das Personal in der Bedienung der Klimageräte ausreichend geschult (z.B. neuer Controller des Klimagerätes)?
  • Gibt es Gewissheit darüber, dass die Betriebsparameter optimal aufeinander abgestimmt sind?

Wer die eine oder andere Frage negativ beantworten muss, der hat Handlungsbedarf und sollte sich im Zweifelsfall Rat bei Experten holen. Wenn Bauherrn planen, externes Know-how hinzuziehen, sollte das in einer frühen Phase des Rechenzentrum-Neubaus erfolgen. Denn zu diesem Zeitpunkt lassen sich typische Fehlerquellen mit entsprechendem Know-how leicht identifizieren und ausschalten. Nachträgliche bauliche Änderungen hingegen sind oftmals ­aufwendig.

Rolf Walter
Rolf Walter (Bild: TÜV Rheinland)

Übrigens: Wer einen externen Dienstleister einschaltet, sollte darauf achten, dass dieser über alle Phasen hinweg als zentraler Ansprechpartner zur Verfügung steht: von der ersten Planung des Rechenzentrums bis zur Inbetriebnahme.

Know-how

Hintergründe und Informationsblätter zum Thema Rechenzentrum bietet der TÜV Rheinland online.

Über den Autor

Rolf Walter ist Leiter des Teams Data Center Services beim TÜV Rheinland.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45335960 / Netzwerk-Monitoring)