Volle Transparenz im Netzwerk mit AA-NPM So geht anwendungsorientiertes Netzwerk-Performance-Monitoring
Virtualisierung, Cloud Services, Big Data und die zunehmende Nutzung mobiler Endgeräte erhöhen die Komplexität von Netzwerken – und erschweren deren Analyse und Kontrolle. Abhilfe schaffen Lösungen für anwendungsorientiertes Netzwerk-Performance-Monitoring (AA-NPM), die das Netz bis auf Transaktionsebene durchleuchten. Dies schafft enorme Vorteile.
Anbieter zum Thema

Anwender beschweren sich häufig bei der Netzwerk-Abteilung, wenn eine wichtige Business-Applikation ausfällt oder nur langsam reagiert. Schließlich bildet das Netzwerk die Basis jedes Geschäftsprozesses. Das verantwortliche IT-Team muss die Ursache für die Leistungseinbußen der Applikation so schnell wie möglich lokalisieren und das Problem beheben, damit die Anwender wieder reibungslos arbeiten können. Doch heterogene, gewachsene Infrastrukturen und neue Technologien erschweren diese Aufgabe sowie die zentrale, umfassende Kontrolle des Netzwerks.
Aktuelle IT-Trends wie Virtualisierung, Big Data, Cloud-basierte Services, Mobile Computing oder Software Defined Networking (SDN) sorgen dafür, dass die Netzwerke größer, schneller und auch komplexer werden. Klassische Tools für die Überwachung der Funktionsfähigkeit und vor allem der Geschwindigkeit des Netzwerkverkehrs gelangen daher an ihre Grenzen. Sie zeigen häufig nur, ob die Systeme überhaupt laufen und betrachten das Netzwerk losgelöst von den Applikationen. Viele Monitoring- und Analyse-Werkzeuge messen zudem nur einen Teil des Datenverkehrs, da sie nicht mit allen Komponenten funktionieren oder schlichtweg nur eine begrenzte Kapazität an Daten und Transaktionen auswerten können.
Klassische Messverfahren sind unzureichend
Auch einer der größten australischen Carrier nutzte bei einem wichtigen Kunden, einer großen Bundesbehörde des Landes, traditionelle Methoden für die Überwachung des Netzwerks. Der Carrier stellt neben der Netzverbindung auch zentrale Anwendungen bereit, die für die tägliche Arbeit der Behörde von fundamentaler Bedeutung sind. Um die Bandbreite und den Ressourcenverbrauch zu kontrollieren, analysierte der Carrier beispielsweise die Datenströme an den eingehenden und ausgehenden Ports. Dies ermöglicht Rückschlüsse auf die Performance der jeweiligen Anwendungen. Zudem werteten die Mitarbeiter auch die Informationen über den IP-Datenstrom in den Routern und Switches aus und stellten diese grafisch dar.
Diese Ansätze messen zwar die Datenströme und Geschwindigkeiten an Netzwerk-Ports und Anwendungen, lassen aber keine Aussage über einzelne Vorgänge oder Transaktionen zu. Doch als die Behörde vermehrt IP-Telefonie und Video nutzte, stiegen die Anforderungen an das Netzwerk und damit auch an das Monitoring. Ziel war es nun, das konkrete Verhalten der Applikationen während der Benutzung auszuwerten sowie Transparenz über alle Netzwerk- und Anwendungsschichten zu gewinnen:
Welche Anwender oder welche Standorte nutzen gerade welche Applikationen? Wie werden die Daten geliefert, wo werden sie gehosted? Wie schnell antwortet die Anwendung aus Sicht des Nutzers (Reaktionszeit)? Welche Wechselwirkungen bestehen zwischen den einzelnen Netzwerk-Komponenten und dem Verhalten der Anwendung? Wie sehen die Datenverkehrs-Muster an der lokalen und der WAN-Schnittstelle aus?
AA-NPM: Analyse jeder einzelnen Transaktion
Der australische Carrier setzte daher eine Lösung zum Application-Aware (anwendungsorientierten) Netzwerk-Performance-Monitoring (AA-NPM) ein, die auf synthetischem und Real User Monitoring basiert. Synthetisches Monitoring simuliert typisches Nutzerverhalten, indem Roboter, die an verschiedenen Stellen im Netzwerk und im Rechenzentrum installiert sind, in definierten Intervallen immer wieder die gleiche Transaktion ausführen. Die aufgezeichneten Leistungsdaten zeigen aber nur die grundsätzliche Funktionsfähigkeit der Komponenten.
Beim Real User Monitoring werden die Performance-Daten der tatsächlichen Nutzer gespeichert und analysiert. Aus den eingehenden Datenpaketen lassen sich somit die Performancewerte sämtlicher Transaktionen für jeden Standort und jedes Gerät ermitteln und analysieren. Ein AAN-MP-System stellt damit zentrale Leistungsdaten des Netzwerks und der Applikationen bereit wie die Analyse der Antwortzeiten der Applikationen, SNMP-Daten oder Informationen zu den Datenströmen (z.B. NetFlow). Auch der Zustand der einzelnen Links, Geräte und Schnittstellen im Netzwerk wird überwacht.
Der australische Carrier erhält dank AA-NPM einen sehr detaillierten Einblick in die Performance jeder Infrastrukturschicht im LAN und WAN, sei es der Anwendungsserver, Load Balancer oder die Korrelation zwischen dem Datenverkehr im Front-End und Back-End von Applikationen und der unterstützenden Netzwerk-Infrastruktur. Über diese End-to-End-Transparenz finden Techniker schneller heraus, ob die Ursachen für Leistungseinbußen auf Anwendungs- oder Netzwerkebene liegen. Sie können die Problemdomäne und die Ursache schnell identifizieren und bis zur jeweiligen Netzwerk-Komponente, Transaktion oder zum einzelnen Datenpaket nachverfolgen.
Diese Informationen erlauben zudem die proaktivere Fehlersuche bei Leistungsproblemen der Anwendung und reduzieren die mittlere Reparaturzeit nach einem Ausfall eines Systems (MTTR Mean Time To Repair). Dieser Wert über die durchschnittliche Dauer der Wiederherstellung des Systems bildet einen wichtigen Parameter für die Systemverfügbarkeit.
Kriterien für die Auswahl einer AA-NMP-Lösung
Bei der Auswahl einer geeigneten AA-NPM-Lösung sollten Unternehmen auf folgende Punkte besonders achten:
Detailtiefe der Informationen: Manche AA-NMP-Lösungen konzentrieren sich bei der Erfassung der Daten mehr auf die Netzwerkgeräte, die Daten transportieren und verteilen (zum Beispiel Router, Switches und Firewalls), und weniger auf die IP-Pakete selbst, die Detailinformationen zur Reaktionszeit der Anwendungen liefern. Unternehmen sollten daher prüfen, welche Lösung bei der Analyse der Datenpakete am tiefsten geht und die größte Sichtbarkeit im Detail bietet.
Lückenlose Daten: Die Lösung muss alle Geräte, Netzwerk-Komponenten, Verbindungen und Applikationen im Netzwerk automatisch erkennen und überwachen (keine Stichproben), damit der IT-Abteilung keine Informationen entgehen.
Zentrales Dashboard: Ein wichtiges Element von AA-NPM ist ein zentrales, anpassbares Dashboard mit einer Leistungsübersicht des gesamten Netzwerkes. Dort können IT-Verantwortliche genau erkennen, wie viele Nutzer, welche Standorte oder gar welche Transaktionen von einem konkreten Problem betroffen sind und wie sich dieses auf die Geschäftsprozesse auswirkt.
Analyse in Echtzeit: Da die AA-NPM-Lösung für zentrale Applikationen in Echtzeit Informationen zur Nutzung der Bandbreite liefert, zeigt sich, wo das Netzwerk ausgelastet ist und wo mehr Bandbreitenkapazität benötigt wird. Die Lösung muss sofort das entsprechende Personal alarmieren, wenn eine geschäftskritische Anwendung langsamer läuft oder andere Probleme auftreten. Dadurch kann die IT-Abteilung auch die SLAs einfacher einhalten.
Speichern von Daten zur Rekonstruktion von Ereignissen: Die AA-NPM-Lösung sollte alle Datenflüsse, Transaktionen und Datenpakete speichern, um zeitweilig auftretende Probleme im Nachhinein rekonstruieren zu können und diese Fehler in Zukunft zu verhindern.
Fazit
Unternehmen können mit einer AA-NPM-Lösung ihr Netzwerk optimieren und komplexe Anwendungsprobleme lösen. Dies gelingt, weil sie damit vom Rechenzentrum und/oder der Cloud über die Netzwerkinfrastruktur bis zum Endgerät des Anwenders die gesamte Lieferkette der Anwendungen bis hinunter zur Transaktionsebene erfassen, analysieren und darstellen können.
Dadurch ist es möglich, Hotspots sowie Performance- und Netzwerkengpässe schnell zu identifizieren und zu beseitigen. Zudem können IT-Teams auf Basis der so erfassten Daten proaktiv Problemen vorbeugen bzw. diese lösen, bevor Geschäftsprozesse beeinträchtigt werden.
Über den Autor
Christian Grimm ist Sales Engineering Manager DACH bei Dynatrace.
(ID:43414874)