Mobile-Menu

Definition Was ist ein Neuronales Netz?

Von Dipl.-Ing. (FH) Stefan Luber tutanch

In der Informatik ist ein Neuronales Netz ein von der Funktionsweise und dem Aufbau des menschlichen Gehirns inspiriertes Modell. Neuronale Netze bilden die Grundlage der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML). Problemstellungen lassen sich mit Hilfe der Neuronalen Netze rechnerbasiert lösen. Aufgebaut sind die mathematischen Netzmodelle aus Neuronen, die in verschiedenen Schichten angeordnet sind.

Die wichtigsten IT-Fachbegriffe verständlich erklärt.
Die wichtigsten IT-Fachbegriffe verständlich erklärt.
(Bild: © aga7ta - stock.adobe.com)

Neuronale Netze werden in der Informatik, Neuroinformatik und Robotik auch als Künstliche Neuronale Netze, abgekürzt KNN, bezeichnet. Es handelt sich um abstrahierte mathematische Modelle, die in ihrem Aufbau und in ihrer Funktionsweise dem Aufbau biologischer Gehirne nachempfunden sind.

KNNs bestehen aus so genannten Neuronen, die in mehreren Schichten angeordnet und unterschiedlich miteinander verbunden sind. Durch die Anordnung und die Verknüpfung der Neuronen entstehen verschiedene Typen Neuronaler Netze wie Feedforward-Netze, Rekurrente Netze oder Convolutional Neural Networks.

Neuronale Netze bilden die Grundlage der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML). Die Netze lassen sich durch unbeaufsichtigtes oder überwachtes Lernen trainieren und sind in der Lage, Problemstellungen aus unterschiedlichen Bereichen computerbasiert zu lösen. Typische Anwendungen sind die Text-, Sprach- und Bilderkennung, Datenanalysen, statistische Auswertungen und vieles mehr.

Der Aufbau eines Neuronalen Netzes

Vereinfacht dargestellt besteht das abstrahierte mathematische Modell eines Neuronalen Netzes aus Neuronen, die in verschiedenen Schichten angeordnet und unterschiedlich miteinander verknüpft sind. Die Neuronen werden auch als Knoten oder Units bezeichnet. Ein Neuron ist in der Lage, an seinem Eingang Informationen von außerhalb oder von einem anderen Neuron entgegenzunehmen, die Information in einer bestimmten Art zu bewerten und sie in veränderter Form am Neuronenausgang an ein weiteres Neuron weiterzuleiten oder als Endergebnis auszugeben.

Grundsätzlich ist eine Unterscheidung der Neuronentypen Input-Neuronen, Hidden-Neuronen und Output-Neuronen möglich. Input-Neuronen bilden den Eingang eines Künstlichen Neuronalen Netzes und nehmen Informationen aus der Außenwelt auf. Hidden-Neuronen sind zwischen den Input-Neuronen und Output-Neuronen angeordnet. Je nach Netzwerktyp können mehrere Schichten von Hidden-Neuronen vorhanden sein. Sie sorgen für die Weiterleitung und Verarbeitung der Informationen. Output-Neuronen liefern schließlich ein Ergebnis und geben dieses an die Außenwelt aus.

Die Verbindungen zwischen den Neuronen werden auch als Kanten bezeichnet. Kanten verbinden einen Ausgang eines Neurons mit dem Eingang eines anderen Neurons. Die Kanten lassen sich gemäß ihrer Bedeutung gewichten. Je stärker eine Kante gewichtet ist, desto größer ist der Einfluss, den das Ausgabesignal eines Neurons auf ein anderes Neuron ausübt. Grundsätzlich ist eine Unterscheidung zwischen positiven und negativen Gewichtungen möglich. Dementsprechend hat die Gewichtung einen anregenden oder einen hemmenden Einfluss auf das verbundene Neuron.

Eine Gewichtung von Null steht für eine neutrale Neuronenverbindung. Das Wissen und Problemlösungsverhalten eines Neuronalen Netzes ist in den Kanten, ihren Gewichtungen und den in den Knoten (Neuronen) abgebildeten Schwellwerten oder Verarbeitungsregeln gespeichert. Die Fähigkeit komplexe Problemstellungen zu lösen, hängt von der Anzahl der Neuronen, den vorhandenen Neuronenschichten und der Vernetzungsart der Neuronen ab.

Wird ein Neuronales Netz trainiert, verändern sich die Gewichtungen der Verbindungen. Das Lernen basiert auf vorgegebenen Lernregeln und den erzielten Ergebnissen. Je mehr Neuronen und Verbindungen in einem Künstlichen Neuronalen Netz vorhanden sind, desto mehr Rechenleistung ist für die Lernvorgänge und den Betrieb des Netzes notwendig.

Typen von Neuronalen Netzen

Neuronale Netze existieren in vielen verschiedenen Strukturen und Komplexitätsgraden. Im Folgenden wird auf einige der wichtigsten Grundtypen Neuronaler Netze eingegangen. Prinzipiell kann zwischen dem einfachen Perzeptron, Feedforward-Netzen, Rekurrenten Netzen und Convolutional Neural Networks unterschieden werden.

Die einfachste Form eines Neuronalen Netzes ist das Perzeptron. Es besteht aus einem einzigen Neuron, das eine Eingangsinformation abhängig von einer Gewichtung und einem Schwellwert in eine Ausgangsinformation wandelt. Teilweise wird der Begriff Perzeptron auch für einlagige Feedforward-Netze genutzt.

In einem Feedforward-Netz fließen die Informationen immer in Vorwärtsrichtung. Der Informationsfluss startet an den Input-Neuronen. Über ein oder mehrere Schichten von Hidden-Neuronen werden die Informationen an die Output-Neuronen weitergeleitet, die schließlich das Ergebnis liefern.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Netzwerktechnik, IP-Kommunikation und UCC

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Das Rekurrente Neuronale Netz (RNN) unterscheidet sich vom Feedforward-Netz darin, dass Informationen über Rückkopplungen der Neuronen gleicher oder unterschiedlicher Schichten auch in Gegenrichtung fließen können, bevor sie anschließend wieder in Vorwärtsrichtung weitergegeben werden. Diese Neuronenverschaltung ist biologischen Gehirnen ähnlicher. Es lassen sich komplexere Verarbeitungslogiken abbilden und zeitlich kodierte Informationen gewinnen. Abhängig davon, wie die Neuronen miteinander verschaltet und rückgekoppelt sind, werden diese Typen Rekurrenter Neuronaler Netze unterschieden: Direct-Feedback-Netze, Indirect-Feedback-Netze, Lateral-Feedback-Netze und Complete-Feedback-Netze.

Die Abkürzung für das Convolutional Neural Network lautet (CNN). Der Deutsche Begriff für das CNN ist "Gefaltetes Neuronales Netz". Diese Sonderform des Neuronalen Netzes kommt häufig für Anwendungen wie die Verarbeitung von Bild- oder Audiodaten zum Einsatz. Der Aufbau ist von der Sehrinde des menschlichen Gehirns inspiriert. Das CNN besteht aus mehreren Schichten. Häufig sind es fünf Schichten. Es sind Faltungsschichten, voll vermaschte Schichten und Subsampling-Schichten vorhanden. Mustererkennungen finden in mehreren Schichten statt, die als Ergebnis jeweils an die nächste Schicht weitergegeben werden.

Training eines Neuronalen Netzwerks

Um ein Neuronales Netz für die computerbasierte Lösung einer Problemstellung einzusetzen, muss es zunächst trainiert werden. Dieser Vorgang wird auch als Maschinelles Lernen (ML) bezeichnet. Vereinfacht dargestellt werden anhand vorgegebener Lernregeln und Trainingsdaten die Verbindungen der Neuronen so lange gewichtet und optimiert, bis das Neuronale Netzwerk die gewünschten Ergebnisse liefert. Das Lernen findet entweder überwacht oder unbeaufsichtigt statt. Das überwachte Lernen liefert passend zu den Trainingsdaten die jeweils richtigen Lösungen und gibt dem Neuronalen Netzwerk Rückmeldung zu den Soll- und Ist-Ergebnissen. Auf Basis dieser Rückmeldungen werden die Neuronenverbindungen optimiert. Beim unbeaufsichtigten Lernen existieren keine Ergebnisvorgaben. Das Lernen findet auf Basis von Lernregeln wie der adaptiven Resonanztheorie oder der Hebb‘schen Lernregel und der Eingabemuster statt.

Typische Anwendungen Neuronaler Netzwerke

Künstliche Neuronale Netze lassen sich für viele verschiedene Anwendungen einsetzen. Sie eignen sich optimal für Problemstellungen, bei denen nur geringes systematisches Lösungswissen vorhanden ist, aber eine große Menge von Eingabeinformationen existiert. Typische Anwendungen Neuronaler Netze und Künstlicher Intelligenz sind:

  • Sprach-, Text- und Bilderkennung
  • Simulationen und Prognosen wie Wettervorhersagen
  • medizinische Diagnostik
  • industrielle Regelungstechnik und Steuerung komplexer Prozesse
  • Analysen großer Datenmengen und Zeitreihen
  • rechnerbasierte Übersetzungen
  • biometrische Systeme
  • Berechnung von Wirtschaftsmodellen
  • autonomes Fahren
  • Frühwarnsysteme
  • Empfehlungs- und Marketingsysteme

(ID:46832416)