Die Komplexität der Datacenter-IT steigt, das Verwaltungsbudget nicht

So sieht zeitgemäßes RZ-Monitoring aus

| Autor / Redakteur: Matthias Maier (Redaktion: Ulrike Ostler) / Andreas Donner

Wer den Zoo aus On-Premise-Anwendungen, hybriden Konzepten und Cloud-First-Modellen im Griff haben will, benötigt ein Monitoring, das die Fehlerbehebung erlaubt, bevor die Nulllinie erreicht ist.
Wer den Zoo aus On-Premise-Anwendungen, hybriden Konzepten und Cloud-First-Modellen im Griff haben will, benötigt ein Monitoring, das die Fehlerbehebung erlaubt, bevor die Nulllinie erreicht ist. (Bild: gemeinfrei - PublicDomainPictures/ Pixabay / CC0)

Die Anzahl von Systemen in virtuellen Rechenzentren und hybriden Umgebungen nimmt wie die Datenmenge zu. Hinzu kommen neue technische Alternativen wie Container. Trotzdem müssen die Systeme reibungslos funktionieren, möglichst mit maximaler Verfügbarkeit der Geschäftsanwen­dungen. Wünschenswert wäre eine proaktive Überwachung aller Einheiten. Wie geht das?

Um etwaige Störungen frühzeitig, bestenfalls bereits vor dem Eintreten, erkennen oder vorhersagen zu können, sind IT-Admins auf Anwendungen angewiesen, die ihnen einen Gesamtüberblick verschaffen. Diese helfen ihnen, die Sicherheit im Sinne eines reibungslosen Betriebs und hoher Verfügbarkeit zu verbessern. Dabei darf es keine Rolle spielen, welche Systeme und Anwendungen Teil der Architektur sind und wie sie betrieben werden.

Welches aktuell die größten Herausforderungen für IT-Admins im Hinblick auf das Rechenzentrums-Monitoring sind, haben Splunk Inc. und das unabhängige Forschungsinstitut Ponemon im Rahmen einer internationalen Studie im Frühjahr 2018 untersucht. Zu den insgesamt knapp 2.500 Befragten zählen auch etwa 430 deutsche Teilnehmer. Die Herausforderungen der IT-Admins sind, bis auf geringe Abweichungen, in Deutschland und andernorts sehr ähnlich.

Die gesamte Studie „Reducing Complexity in IT Infrastructure Monitoring: A Study of Global Organizations“ gibt es bei Splunk gegen Registrierung zum Download.
Die gesamte Studie „Reducing Complexity in IT Infrastructure Monitoring: A Study of Global Organizations“ gibt es bei Splunk gegen Registrierung zum Download. (Bild: Ponemon/Splunk)

Reducing Complexity in IT Infrastructure Monitoring: A Study of Global Organizations

Intransparente Strukturen

Ein Großteil der Verantwortlichen sieht sich nicht in der Lage, die noch komplexer werdende IT-Infrastruktur zu überwachen und im Störungsfall einzugreifen. Laut den Befragten sind IT-Infrastrukturen basierend auf On-Premises und Public Cloud besonders weit verbreitet: 36 Prozent gaben an, dass ihre Strukturen weiterhin vorrangig On-Premises sind, 32 Prozent betreiben ihre Systeme bereits vollständig in einer Public Cloud. 24 Prozent beschreiben ihre Systeme als hybride Lösungen, weitere 8 Prozent betreiben ihre Systeme in einer eigenen Private Cloud.

Damit ist das Feld der relevanten verfügbaren Architekturen extrem breit. Sollen Daten in die Cloud umziehen, rechnet jeder vierte Befragte mit neuen Herausforderungen.

47 Prozent geben an, dass die Beherrschung der Systeme die größte Herausforderung beim Management der IT ist. Im direkten Zusammenhang damit steht die mangelnde Transparenz: Jeder Zweite tut sich schwer, Probleme zu erkennen und deren Ursachen zu identifizieren. 42 Prozent sind der Meinung, dass Cloud-basierte Services und deren geringe Übersichtlichkeit eine effektive System-Überwachung erschweren.

Kompetenzen sind noch ausbaufähig

Zusätzlich bereitet das unzureichende Wissen beim Troubleshooting und Monitoring Probleme: 44 Prozent geben an, dass ihre Teams nicht über die nötigen Kompetenzen verfügen. Etwa ein Drittel sieht in zu geringen Budgets für das Rechenzentrums-Monitoring einen weiteren Risikofaktor.

Trotzdem gehen 41 Prozent davon aus, dass sich die Budgets für den IT-Betrieb in den kommenden zwölf Monaten nicht sehr stark verändern werden. Darüber hinaus erwartet jeder zweite Befragte gar budgetäre Einschränkungen, wenn es um die Anschaffung neuer Tools für das Troubleshooting und Monitoring geht.

Außerdem sind die IT-Abteilungen nicht optimal auf Störfälle vorbereitet: Nur 29 Prozent geben an, dass sie dokumentierte Workflows und automatisierte Prozesse haben, um auf eine ungeplanten Downtime adäquat zu reagieren.

Ruhe und Überblick bewahren!

Monitoring-Systeme können zwar die Komplexität der IT-Infrastruktur per se nicht reduzieren, helfen den IT-Admins aber dabei, den Überblick zu bewahren und auf Vorfälle schnell und adäquat zu reagieren. Zunächst haben die Teams mit dem Monitoring-Tool die Möglichkeit, die Quelle der aktuellen Störung zu identifizieren. Basis dafür sind Metriken wie CPU- und Arbeitsspeicher-Auslastung.

Korrelierte Metriken und Protokolle: Es reicht nicht, zu wissen, was passiert ist, man muss wissen, warum. „Splunk Insights for Infrastructure“ analysiert Metriken und Protokolle in einer einheitlichen Umgebung, so dass sowohl eine Überwachung als auch die Fehlerbehebung machbar sind. Trends, Status und Ereignisse finden sich in einer Ansicht, um schnell das Warum zu finden.
Korrelierte Metriken und Protokolle: Es reicht nicht, zu wissen, was passiert ist, man muss wissen, warum. „Splunk Insights for Infrastructure“ analysiert Metriken und Protokolle in einer einheitlichen Umgebung, so dass sowohl eine Überwachung als auch die Fehlerbehebung machbar sind. Trends, Status und Ereignisse finden sich in einer Ansicht, um schnell das Warum zu finden. (Bild: Splunk)

Doch erst die Klärung der Ursachen macht ein effektives Troubleshooting möglich – und diese Informationen stecken in den Log-Daten. Um effektiv zu sein, kombinieren moderne Systeme Metriken und Logs automatisch in einer Anwendung. So liefert ein Blick auf das Monitoring sofort umfassende Erkenntnisse.

Wenn zum Beispiel viele Personen gleichzeitig eine mobile Website nutzen, versursacht das einen CPU-Spike und die Performance des Dienstes bricht ein. Korreliert man den Spike mit den Log-Daten – also der Anzahl der Benutzer oder Anfragen – lässt sich die Ursache schnell erkennen und das Problem kann gelöst werden. Das Monitoring-System zeigt auch, welche Komponente der erste Engpass sein wird. Mit einem derart proaktiven Monitoring identifizieren die Verantwortlichen Trends und können reagieren, bevor die Störung eintritt.

Monitoring bei der Cloud-Migration

Monitoring-Lösungen helfen auch, Anwendungen fehlerfrei von einer On-Premise- in eine Cloud-Umgebung zu migrieren. IT-Admins sollten einen solchen Umzug so überwachen, dass sie die Leistung in der ursprünglichen Infrastrukturumgebung messen und verstehen können. Nur dann können sie sicherstellen, dass sich die Performance der Dienste während der Migration und im späteren Cloud-Betrieb nicht verschlechtert. Da auch die Software einer Cloud-Lösung immer wieder aktualisiert wird, hilft das Monitoring auch nach dem Umzug, die Applikation stets kompatibel zu halten und störungsfrei zu betreiben.

Anforderungen an ein Monitoring

Doch was ist wichtig für die Auswahl eines passenden Werkzeugs? Das neue Tool sollte einfach und schnell zu implementieren sein. Zu klären gilt es ebenfalls Skalierbarkeit und Lizenzierung. Entscheiden sich die Admins zunächst für eine kostenfreie Lösung, sollten sie sich informieren, ob ein Upgrade auf eine umfassendere Lösung möglich ist und was diese beinhaltet.

Anbieter wie Splunk mit ihrem Monitoring-Werkzeug „Insights for Infrastructure“ integrieren ihre Monitoring-Lösung ab dem Enterprise-Level in ein übergeordnetes Produkt, das eine Vielzahl von Anwendungsfällen abdeckt und auch auf künstliche Intelligenz setzt. Letztendlich sollte die Lösung in heterogenen sowie hybriden Strukturen mit verschiedenen Systemen und Cloud-Anbietern kompatibel sein und einwandfrei arbeiten.

Je nach Fragestellung behalten IT-Teams dann mit ihrer Monitoring-Lösung das große Ganze im Blick oder einzelne Einheiten, um Probleme zu erkennen und zu beheben, bevor sie sich auf die Rechenzentrumsleistung und damit die jeweiligen Angebote der Unternehmen auswirken. Es empfiehlt sich, zunächst einen Teilbereich der eigenen Infrastruktur zu beobachten, um sich zu vergewissern, dass die Lösung die gewünschten Ergebnisse erzielt. Vorgefertigte Dashboards und Integrationen – beispielsweise in Amazon-Web-Service-Umgebungen – vereinfachen den Start zusätzlich.

Matthias Maier.
Matthias Maier. (Bild: Splunk)

Vorsorge statt Verkleinern der Probleme

Aus unternehmerischer Sicht dient eine Monitoring-Lösung dazu, Geschäftsanwendungen zuverlässiger und schneller zu machen. Das trägt zu einer gesteigerten Kundenzufriedenheit und schlussendlich zu wettbewerbsfähigeren Angeboten bei. Hektische ‚Brandbekämpfung‘ ist nicht mehr nötig, da Probleme im System frühzeitig erkannt und Vorfälle vermieden werden. Effektives Monitoring ist die beste Möglichkeit, komplexe und intransparente Systeme wieder erfolgreich zu verwalten.

Über den Autor

Matthias Maier ist Security-Spezialist bei Splunk Inc.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45430975 / Netzwerk-Monitoring)