Mobile-Menu

KI-Einsatz im Network Operations Center Ereignisgesteuerte Automatisierung im NOC

Von Hannah Culver 5 min Lesedauer

Anbieter zum Thema

Die Steigerung der Effizienz im Unternehmen mit Hilfe von künstlicher Intelligenz (KI) und Automatisierung ist ein von Investoren, Vorstandsmitgliedern und CEOs hoch priorisiertes und von CIOs heiß diskutiertes Thema. Eine der Herausforderungen in vielen Unternehmen ist die Frage: Womit soll man anfangen?

Gerade im Network Operations Center (NOC) kann der Einsatz von KI zu großen Arbeitserleichterungen und Effizienzsteigerungen führen.(Bild:  muhamad - stock.adobe.com / KI-generiert)
Gerade im Network Operations Center (NOC) kann der Einsatz von KI zu großen Arbeitserleichterungen und Effizienzsteigerungen führen.
(Bild: muhamad - stock.adobe.com / KI-generiert)

CIOs haben die Aufgabe, Kosten zu senken und gleichzeitig die IT-Risiken für das Unternehmen zu minimieren. Insbesondere die Vermeidung von Störungen der digitalen Dienste ist ein wichtiger Bereich, in dem Verbesserungen erzielt werden können. Jede Unterbrechung hat Auswirkungen auf das Team, die Kunden und den Gewinn. Störungen im Betrieb werden meist durch ein oder mehrere Vorfälle ausgelöst. Beispiele dafür können ein Ressourcenengpass oder ein Ausfall einer wichtigen Komponente sein.

Incidents werden oft über eine zentrale Stelle gemeldet: das Network Operations Center (NOC). Die Flut eingehender Meldungen und die manuelle Bearbeitung wiederkehrender Aufgaben belasten jedoch die Teams. Häufige Eskalationen von Level-1- und Level-2-Respondern an Fachexperten (SME) sorgen zudem für Zeitverlust und machen den Betrieb kostspielig.

Deshalb ist das effiziente Management von Vorfällen ein guter Startpunkt für die Einführung von künstlicher Intelligenz (KI) und ereignisgesteuerter Automatisierung, um Meldungen zu priorisieren und schneller den richtigen Fachexperten einzubinden. IT-Verantwortlichen hilft es, die Mitarbeitenden in ihrem NOC zu entlasten.

Was ist ereignisgesteuerte Automatisierung?

Ereignisgesteuerte Automatisierung ist ein Ansatz, bei dem Prozesse, Systeme oder Workflows sofort automatisch gestartet werden, sobald ein definiertes Ereignis erkannt wird, z.B. wenn Daten aus vertrauenswürdigen Quellen wie einem Überwachungsprogramm eingehen. Im NOC ermöglicht die ereignisgesteuerte Automatisierung sofortige Reaktionen auf eingehende Daten, reduziert manuelle Eingriffe, steigert die Effizienz und ermöglicht proaktives Handeln. Mitarbeiter müssen nur dann eingreifen, wenn menschliche Fähigkeiten und Kenntnisse erforderlich sind.

Diese Automatisierung entlastet das IT-Team von sich wiederholenden Aufgaben wie Systemüberwachung, Fehlerbehebung oder Infrastrukturmanagement. Mit Hilfe der KI bzw. maschinellem Lernen (ML) kann das System im Laufe der Zeit auf weitere Anwendungsfälle abgestimmt werden. Die schnelle, automatisierte Reaktion hilft, Unterbrechungen zu vermeiden oder zu minimieren, z.B. durch einen automatisierten Neustart eines Systems bei einem Ausfall. Wertvolle Fachkräfte müssen weniger Zeit damit verbringen, Dashboards zu beobachten und Vorfälle manuell zu eskalieren.

Ereignisgesteuerte Automatisierung ermöglicht es, auch bei wachsender Komplexität der IT-Landschaft flexibel und effizient zu bleiben. Cloud-Dienste und Systeme wie DevOps-Tools oder Monitoring-Plattformen können nahtlos miteinander verknüpft werden, um fundierte Entscheidungen zu treffen.

Teams entlasten, Kundenzufriedenheit verbessern

Mit KI können Kontext ergänzt und Diagnosen automatisiert werden. Damit stehen Informationen zur Verfügung, um die Ursache besser zu verstehen. Diese Erkenntnisse helfen, künftig den Aufwand zu reduzieren und ähnliche Vorfälle zu vermeiden. Zusätzlich entsteht ein positiver Dominoeffekt, denn mit zunehmender Automatisierung profitieren auch andere Teams von modernisierten NOC-Prozessen.

Site Reliability Engineering (SRE) und Platform Engineering Teams: In SRE- und Platform-Engineering-Teams ermöglicht Automatisierung, dass ein Mensch nicht mehr mit Aufgaben behelligt wird, die eine Maschine erledigen kann. Dazu gehört auch die automatische Fehlerbehebung, bei der einfachere IT-Vorfälle ohne menschliches Eingreifen vollständig gelöst werden. Mit der Unterstützung generativer künstlicher Intelligenz (GenAI) lassen sich zudem automatisierte Skripte – so genannte Runbooks – erstellen, mit denen Probleme schneller behoben werden. Die MTTRs (Mean Time to Response / Mean Time to Repair) und die Auswirkungen einer Unterbrechung z.B. auf die Kundenerfahrung werden minimiert.

Major Incident Management Teams (MIM): MIM-Teams sollten nur bestätigte Vorfälle erhalten, die Auswirkungen auf Kunden haben und die nicht automatisch behoben werden können. Dabei sind sie darauf angewiesen, dass das NOC-Probleme grundsätzlich richtig kategorisiert und entsprechend sofort weiterleitet. Die Automatisierung von Diagnosen und Anreicherung mit Triage-Informationen liefern den MIM-Teams den richtigen Kontext für eine sofortige Reaktion. Nach dem Vorfall sind die MIM-Teams oft die treibende Kraft für kontinuierliches Lernen. Mit ihren Auswertungen stellen sie sicher, dass weitere Automatisierungen integriert werden können, um die Plattform, Systeme und Betriebsprozesse zu optimieren. So können ähnliche Vorfälle verhindert beziehungsweise deren Auswirkungen weiter reduziert werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Netzwerktechnik, IP-Kommunikation und UCC

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Engineering Teams: Mit der ereignisgesteuerten Automatisierung erhalten nur diejenigen technischen Mitarbeiter Benachrichtigungen über Vorfälle, die diese auch tatsächlich bearbeiten müssen. Basierend auf automatisierten Analysen und Berichten können die Teams eine automatische Behebung für wohlverstandene Probleme erstellen und die gewonnene Zeit für weitere Innovationen nutzen.

Kundenservice: Probleme lassen sich automatisiert lösen und Fehler beheben, bevor die Kunden die Auswirkungen bemerken. Support-Teams sehen sich weniger mit verärgerten Kunden konfrontiert und werden mit besseren Daten versorgt.

Von der ereignisgesteuerten Automatisierung im NOC können also Teams im gesamten Unternehmen profitieren. Es gibt jedoch auch ein paar Voraussetzungen zu beachten, die für den Erfolg der ereignisgesteuerten Automatisierung kritisch sind.

Herausforderungen bei der Umsetzung

Ein entscheidender Faktor ist die Verfügbarkeit der Daten. Für die effektive, ereignisgesteuerte Automatisierung im Vorfallmanagement ist die Integration mit Monitoring-, Logging- und SIEM-Systemen sowie weiteren Tools unerlässlich. Diese kontextabhängigen Daten liefern wertvolle Informationen für die Korrelation von Ereignissen, Entscheidungsgrundlagen und abschließende Analysen. Stehen nicht genügend Informationen zur Verfügung, kann ein falsch erkanntes Ereignis zu unnötigen Sperrungen oder Eskalationen führen.

IT-Verantwortliche müssen sich darüber im Klaren sein, dass sich nicht alle Vorfälle standardisieren lassen. Komplexe Szenarien erfordern oft nach wie vor manuelle Eingriffe. Die Automatisierung wohlverstandener Ereignisse schafft den Fachkräften jedoch den nötigen Freiraum, komplexere Probleme effizienter zu lösen.

Die Implementierung einer ereignisgesteuerten Architektur kann technisch anspruchsvoll sein. Um Missbrauch oder unautorisiertes Auslösen zu verhindern, muss Automatisierung Teil der Sicherheitsstrategie sein und regelmäßig getestet werden.

Der Wert ereignisgesteuerter Automatisierung

Um den Wert einer Initiative zu belegen, muss sie an den wichtigsten Zielen des Unternehmens wie dem Gewinn ausgerichtet sein. Schon ein einziger Vorfall, der abgewendet oder dessen Auswirkungen reduziert werden, kann sich auf den Erfolg des Unternehmens auswirken. Je schneller ein Vorfall behoben wird, desto geringer sind die Auswirkungen auf den Umsatz, beispielsweise wenn geringere oder gar keine Vertragsstrafen in Bezug auf Service Level Agreements (SLA) anfallen oder die Unterbrechungen so gering sind, dass sie weder Betrieb noch Kundenerfahrung beeinträchtigen.

Hanna Culver.(Bild:  PagerDuty)
Hanna Culver.
(Bild: PagerDuty)

Fazit

Automatisierung und KI sind unerlässliche Werkzeuge zur Erreichung wichtiger Unternehmensziele. Für IT-Verantwortliche ist es wichtig, neue Technologien zu verstehen und einzuschätzen, wo sie am besten in die betrieblichen Abläufe passen. Kleine Schritte am Anfang erleichtern die Einführung neuer Technologien. Die ereignisgesteuerte Automatisierung im NOC bewirkt Verbesserungen in der gesamten Organisation und ist ein guter Anfang.

Über die Autorin

Hannah Culver ist Produktmarketing-Managerin bei PagerDuty. Sie verfügt über fünf Jahre Erfahrung im Bereich Incident Management.

(ID:50327201)