Mobile-Menu

Opengear nennt organisatorische und technische Schwachstellen 7 typische Fehler beim Beheben von Netzwerk-Downtimes

Von Bernhard Lück 3 min Lesedauer

Anbieter zum Thema

Zeitdruck, mangelhafte Prozesse und eine unzureichende Tool-Infrastruktur sorgen dafür, dass Netzwerkausfälle länger dauern als nötig. Out-of-Band-Spezialist Opengear identifiziert sieben Fehlerquellen, die im Ernstfall typischerweise auftreten – und zeigt Gegenmaßnahmen auf.

Was schiefgehen kann, geht auch schief – Murphys Gesetz bewahrheitet sich auch im Falle von Netzwerkausfällen viel zu oft.(Bild:  © Pippin – stock.adobe.com / KI-generiert)
Was schiefgehen kann, geht auch schief – Murphys Gesetz bewahrheitet sich auch im Falle von Netzwerkausfällen viel zu oft.
(Bild: © Pippin – stock.adobe.com / KI-generiert)

Out-of-Band-Spezialist Opengear hat eine Liste häufiger Fehler veröffentlicht, die Administratoren bei der Behebung von Netzwerkausfällen unterlaufen. Die Analyse richtet sich an IT-Teams, die ihre Incident-Response-Prozesse überprüfen und verbessern wollen. Im Fokus stehen organisatorische wie technische Schwachstellen.

1. Keine echte Ursachenanalyse

Insbesondere der Zeitdruck, der bei einem Netzwerkausfall entsteht, verleitet Administratoren dazu, möglichst schnell einen Fix zu implementieren. Ob das ursächliche Problem damit tatsächlich aus der Welt geschafft wurde, ist in diesem Fall zweitrangig. Das kann dazu führen, dass der gleiche Fehler erneut auftritt. Besser ist es, den Fehler mit der nötigen Ruhe systematisch via Root-Cause-Analyse zu untersuchen und erst dann Maßnahmen zu ergreifen, wenn der Ursprung wirklich klar identifiziert ist.

2. Schlechte Kommunikation

In vielen Unternehmen arbeiten die verschiedenen Stakeholder in der IT isoliert voneinander. Diese Silos erschweren die Abstimmung oder machen sie gar unmöglich, insbesondere in Notsituationen. Sinnvoller ist es, wenn Teams interoperabel miteinander kommunizieren, denn selten sind Downtimes ausschließlich im Verantwortungsbereich der Netzwerkadministratoren begründet.

3. Fehlende Visibilität

Ein Leitsatz aus der Cybersecurity lautet: „You can’t protect what you can’t see.“ Und genau so ist es auch im Netzwerkbereich, denn Administratoren können Fehler nicht beheben, die sie nicht sehen. Läuft das Monitoring etwa in Ermangelung einer Out-of-Band-Lösung über das Produktivnetzwerk, sind Admins im Problemfall blind und haben keine Möglichkeit, remote auf elementare Komponenten zuzugreifen oder eine Diagnose zu erstellen. Da auch ein rein gespiegeltes Netzwerk bei einem Ausfall häufig in die Knie geht, sollten Unternehmen eine Service-Infrastruktur mit Out-of-Band-Netzwerk aufbauen. Nur so behalten Administratoren auch im Notfall die volle Kontrolle.

4. Falsche Priorisierung

Manchmal erkennen Netzwerkadministratoren kritische Probleme erst zu spät und eskalieren daher nicht rechtzeitig. Das passiert häufig, wenn mehrere Probleme gleichzeitig auftreten. Unternehmen sollten, um falschen Priorisierungen vorzubeugen, klare Triage-Prozesse implementieren und Eskalationsmatrizes erarbeiten.

5. Quick Fixes

Schnelle Lösungen für komplexe Probleme ziehen oft einen Rattenschwanz an weiteren Problemen nach sich. Um möglichst schnell wieder online zu sein, setzen Netzwerkadmins manchmal auf sogenannte Quick Fixes, also instabile und spontan implementierte Problemlösungen. Statt auf unsichere Workarounds zu setzen, sollten Netzwerk-Teams vielmehr sichere Recovery-Prozesse durchführen, um Fehler nachhaltig zu beheben.

6. Mangelhaftes Testing

Ein leider weitverbreiteter Fehler ist, dass Netzwerk-Teams Updates ausrollen, ohne sie ausgiebig getestet zu haben. Das gleiche gilt für Änderungen an der bestehenden Konfiguration. Fehlendes oder zu oberflächliches Testing kann Schwachstellen ins System bringen oder zu Downtimes führen. Daher gilt die goldene Regel: Änderungen jeglicher Art immer testen, Rollback-Pläne bereithalten und erst dann kontrolliert Updates oder neue Konfigurationen ausrollen.

7. Blindes Vertrauen in (KI-)Tools

Ein Phänomen der aktuellen Zeit ist, dass immer mehr Netzwerkadministratoren sich blind auf KI und andere Tools verlassen. Oft sind die Ergebnisse wunderbar und hilfreich, aber ein gewisses Maß an Skepsis sollten sich Admins immer erhalten. Gerade bei kritischen Problemen gilt es, die Ergebnisse zu validieren und für die finale Entscheidung auf die eigene Expertise zu vertrauen.

Dirk Schuma ist Sales Manager EMEA North bei Opengear.(Bild:  Opengear)
Dirk Schuma ist Sales Manager EMEA North bei Opengear.
(Bild: Opengear)

„Fehler passieren, gerade im Ernstfall“, betont Dirk Schuma, Sales Manager EMEA North bei Opengear. „Daher ist es wichtig, sich von Zeit zu Zeit potenzielle Gefahrenquellen vor Augen zu führen und das eigene Verhalten in Krisensituationen zu evaluieren. Nur dann funktionieren Admins im Ernstfall wie eine gut geölte Maschine. Und das ist unbedingt nötig, denn die nächste Downtime kommt bestimmt.“

(ID:50802356)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Netzwerktechnik, IP-Kommunikation und UCC

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung