TK-Anbieter M-net setzt auf op5

So geht Monitoring bei TK-Unternehmen

| Autor / Redakteur: Andreas Schachtner / Andreas Donner

Übersicht über das Monitoring der verteilten Infrastruktutr bei m-Net (grün: Konfigurationsdaten; rot: Statusdaten; magenta: Systemüberwachung).
Übersicht über das Monitoring der verteilten Infrastruktutr bei m-Net (grün: Konfigurationsdaten; rot: Statusdaten; magenta: Systemüberwachung). (Bild: op5)

Bereits vor einigen Jahren hat sich das TK-Unternehmen M-net in Sachen Monitoring für op5 Monitor entschieden. Heute blickt der M-net-Systemmanager Andreas Schachtner zurück auf den erfolgreichen Umbau des Monitoring-Systems und spricht über erzielte Vorteile und zukünftige Herausforderungen.

Seit 1996 versorgt der regional tätige Telekommunikationsanbieter M-net weite Teile Bayerns, den Großraum Ulm sowie den hessischen Landkreis Main-Kinzig mit Kommunikationstechnologie von Telefon und Mobilfunk über Vernetzung und Rechenzentrum bis zum Highspeed-Internet.

Mit dem Erfolg wuchsen auch die Herausforderungen, denen sich das Monitoring der internen IT zu stellen hatte. Und da Zuverlässigkeit für einen Telekommunikationsanbieter höchste Priorität genießt, wollte und konnte man bei M-net in Sachen IT-Sicherheit keine Kompromisse machen. Dank op5 Monitor stimmt nun seit 2012 die Performance wieder: Die Zeit, die zuvor dafür aufgewendet wurde, um reaktiv Störungen zu beseitigen, kann jetzt effizient dazu eingesetzt werden, um diese proaktiv zu verhindern.

Vom Do-it-Yourself-Nagios zum automatisierten Unified Monitoring

380.000 Anschlüsse, 12.000 Kilometer eigene Glasfaserkabel, 330 Ortsvermittlungen und ein Server-Housing auf 2.400 m²: Die Herausforderung, hier rund um die Uhr die Betriebsverantwortung für den Zutritt, den Fernzugang und die Niederlassungsinfrastruktur bis hin zu den Kernapplikationen zu garantieren, hatte es in sich. „Wir suchten eine einheitliche Lösung, die uns eine einfache Administration und vor allem die übersichtliche grafische Darstellung ermöglichte“, erläutert Andreas Schachtner, Systemmanager UNIX, IT-Betrieb und Support bei M-net.

„Unser veraltetes, selbst entwickeltes und auf Nagios basierendes Monitoring-System war den ständig steigenden Anforderungen nicht mehr gewachsen. Dessen Weiterentwicklung erfolgte ausschließlich reaktiv; eine vorausschauende Planung war nicht möglich. Während wir viele administrative Abläufe bereits weitestgehend automatisiert hatten, mussten z.B. neue Hosts oder Services immer noch per Hand im Monitoring-System konfiguriert werden. Wir brauchten eine definierte Schnittstelle; außerdem war es unser Ziel, komplexere Auswertungen einer integrierten Visualisierung der Messdaten auf einer leicht zu bedienenden Konfigurationsoberfläche darstellbar zu machen.“

Die Tabelle zeigt einen Ausschnitt der damals zu bewältigenden Monitoring-Aufgaben und den jeweils dafür notwendigen Zeitaufwand, gemessen in Personentagen (PT). Daraus wird deutlich, wie viel Zeit tatsächlich für das Nagios-Customizing benötigt wurde, ohne dabei die Leistungsfähigkeit des Systems wesentlich zu verbessern. „Wir brauchten eine Out-of-the-Box Appliance-Lösung mit Batch-Konfiguration, Multinode-Fähigkeit und vielen Standard-Checks. Trotz des im Vergleich zu anderen Lösungen höheren Preises hat uns op5 mit seinem permanenten Innovationsansatz überzeugt: Als Kunde profitieren wir direkt von den hohen Investitionen, die in die ständige Weiterentwicklung des Tools gesteckt werden. Und wenn man sich wie wir gleich am Anfang die Implementierung des Systems durch einen Dienstleistung mit einkauft, kann man viele Anfängerfehler – z.B. bei der Nagios-Naemon-Migration – vermeiden.“

Ergänzendes zum Thema
 
Das Unternehmen op5

Ausschnitt aus den vor der op5-Einführung zu bewältigenden Monitoring-Aufgaben und den dafür notwendigen Zeitaufwand, gemessen in Personentagen (PT).
Ausschnitt aus den vor der op5-Einführung zu bewältigenden Monitoring-Aufgaben und den dafür notwendigen Zeitaufwand, gemessen in Personentagen (PT). (Bild: op5)

op5 Monitor: Monitoring garantiert optimale Performance

Die Monitoring-Appliance op5 Monitor vereint Nagios und die wichtigsten Add-ons dafür in einer einheitlichen Lösung. Mittels des umfassenden SLA-Reportings von op5 Monitor überwacht M-net heute seine komplette Geschäfts-IT inklusive der VMware-Umgebungen, Oracle-Datenbanken, Java Applikations-Server und Storage-Systeme sowie aller Netzwerkkomponenten. Bei der Überführung vom Altsystem in op5 Monitor wurden alle vorhandenen Checks analysiert, ggf. angepasst, integriert und durch zahlreiche neue Checks ergänzt.

Insgesamt sichern heute rund 25.000 Checks das Funktionieren der Systeme – das ist etwa das 25-fache gegenüber dem Altsystem. „Dank einer schnellen Root-Cause-Analyse meldet op5 Monitor alle Störungen oder Ausfälle zuverlässig an die jeweiligen Fachabteilungen, die dann vom IT Betrieb zügig behoben werden können. Dabei unterstützt uns die grafische Aufbereitung der Messwerte enorm bei der Erkennung von Anomalien und der pro-aktiven Behebung von eventuellen Performance-Engpässen“, erklärt Andreas Schachtner.

Es wurde darauf geachtet, alle Provisioning-Prozesse möglichst von vornherein automatisiert aufzusetzen, was dank des Network Autoscans von op5 auch sehr gut gelungen ist. Ergänzt wird dies z.B. bei Datenbanken oder Storage-Systemen durch selbstentwickelte Jobs, die die Systeme scannen und dem Monitoring automatisch Instanzen und Volumes hinzufügen. Wie effizient dies funktioniert, zeigt die Übersicht von M-net aus dem Jahr 2015 zu den verschiedenen Zeitaufwänden bzw. geleisteten Checks vor und nach der Implementierung von op5.

Entwicklungsaufwand in Stunden (orange), Anzahl der Services (grau), Anzahl der Hosts (hell-orange) und für das Monitoring aufgewendete Stunden (blau).
Entwicklungsaufwand in Stunden (orange), Anzahl der Services (grau), Anzahl der Hosts (hell-orange) und für das Monitoring aufgewendete Stunden (blau). (Bild: op5)

Die orangen Bereiche zeigen den Entwicklungsaufwand in Stunden; dem gegenüber stehen in grau die Anzahl der Services, die seit der Implementierung von op5 regelrecht explodiert ist. Auch die Anzahl der Hosts ist zügig weiter gestiegen (sie liegt heute bereits doppelt so hoch). Gleich geblieben ist dagegen die mit 384 Stunden für das Monitoring aufgewendete Arbeitszeit (blau), die heute dank op5 sehr viel effizienter eingesetzt werden kann als beim früheren, selbst entwickelten Nagios-System. „Vor op5 haben wir uns mit der Aufrechterhaltung der Basisinfrastruktur und dem Erhalt des Status quo, also Netzwerk und Server Layer, beschäftigt. Heute konfigurieren wir tagesaktuell neue Systeme hinzu und treiben das Monitoring aktiv voran, um zusätzliche Granularität bei der Überwachung – z.B. innerhalb von Applikationen oder Abhängigkeiten – zu erzielen (Applikationen+Business Layer).“

Das umfangreiche Service Reporting ist heute für Andreas Schachtner unverzichtbar, obwohl er es anfangs eher als ‚nice to have‘ eingestuft hatte. Derzeit wird sogar überlegt, SLA-Informationen aus dem Monitoring in das M-net Datawarehouse zu liefern, in dem alle Controlling Daten zusammengeführt werden.

„Jede Woche ist ein anderer Kollege aus dem IT-Betriebsteam für das Monitoring zuständig. So stellen wir sicher, dass keine Alarme verpasst bzw. Probleme zügig abgearbeitet werden. Durch den ständigen Zuständigkeitswechsel sind alle Teammitglieder mit der Funktion bzw. Bedienung von op5 vertraut und wissen, dass das System wirklich immer Recht hat – Fehlfunktionen gibt es bzw. gab es noch nicht. Und falls es doch mal Fragen gibt, steht uns das Team von op5 mit einem ebenso schnellen wir kompetenten Service zur Verfügung.“

Bugfixes, Wartung und Updates werden auch nach Projektabschluss im Rahmen des Supportvertrages von op5 übernommen. Auf diese Weise hat M-net keinen Pflegeaufwand für seine Monitoring-Lösung, weder bei Updates für das Betriebssystem noch bei Updates für das Monitoring-System.

Um die mittlerweile ausgeführten 25.000 Checks bewältigen zu können, wurden in der Zwischenzeit Lizenzen nachgekauft und das Monitoring auf Peer Set-up umgestellt. Dies war u.a. auch deshalb notwendig, um die dringend benötigte Redundanz über beide Rechenzentren hinweg zu garantieren und Ausfälle vermeiden zu können.

Merkmale von op5 Monitor Peer sind lineare Skalierung, Unterstützung geografischer Verteilung und Load Balancing mit besonderem Augenmerk auf einfache Installierbarkeit und Management der Peers. Die Komponente op5 Poller ermöglicht eine Strukturierung des systemweiten Monitorings. Lokal können im Poller Überwachungsdaten gesammelt und bearbeitet und die Ergebnisse an zugeordnete Monitorinstanzen gegeben werden.

Zukünftige Projekte und Herausforderungen

„Die Integration von Umsystemen wie Ticketing, Change Management und Datawarehouse wird immer wichtiger. Die REST API von op5 funktioniert hier bislang einwandfrei, muss aber noch deutlich leistungsfähiger werden. Je größer eine IT-Umgebung ist, desto schwieriger wird es, Schwellwerte passgenau einzustellen. In vielen Fällen könnten adaptive Schwellenwerte Abhilfe leisten – hier gibt es für op5 aus meiner Sicht noch Verbesserungspotentiale. Last but not least benötigen die immer mobiler werdenden Arbeitsplätze einerseits eine zuverlässig funktionierende Wifi-Infrastruktur sowie andererseits Cloud-Webservices, die beide mit Basis-Checks überwacht werden müssen. Diese Funktion wird zukünftig immer wichtiger und sollte daher weiter ausgebaut werden. Künftig könnten auch etwaige Cloud Dienste von op5 für uns ein Thema werden, um einen neutralen Blick von außen auf unsere Services zu erhalten.“

Andreas Schachtner.
Andreas Schachtner. (Bild: op5)

Über den Autor

Andreas Schachtner ist seit 2010 bei M-net als UNIX-Systemmanager beschäftigt. Er ist u.a. für die korrekte Funktion der Kernsysteme (CRM, Billing), der Datenbanken (Oracle, MySQL) und der Speichersysteme (NetApp) verantwortlich und hat die Einführung von op5 Monitor vorbereitet und aktiv begleitet. Seine beruflichen Wurzeln liegen in der Softwareentwicklung; zudem war er am Aufbau diverser zertifizierter Rechenzentren sowie am Betrieb hochverfügbarer Produktionsumgebungen beteiligt.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44122648 / Netzwerk-Monitoring)