Züricher Wissenschaftler nutzen Ereigniskameras und KI, um die Fußgängererkennung in autonomen Autos zu verbessern
Die Forscher Daniel Gehrig und Davide Scaramuzza von der Universität Zürich haben eine neue Methode zur Verbesserung der Fußgängererkennung in autonomen Autos entwickelt. Durch die Verwendung eines speziellen Kameratyps, der sogenannten Event-Kamera, und die Kombination mit KI haben sie ein System entwickelt, das besser funktioniert als die derzeitigen Systeme.
Diesen älteren Systemen entgehen wichtige Details, weil sie nur 30-50 Bilder pro Sekunde aufnehmen. Im Jahr 2022 erreichte die Zahl der bei Verkehrsunfällen getöteten Menschen in den USA ein 41-Jahres-Hoch, was deutlich macht, dass eine bessere Erkennungstechnologie erforderlich ist.
Herkömmliche Systeme verwenden künstliche neuronale Netze, um Objekte wie Fußgänger, Fahrräder und Autos in statischen Bildern zu erkennen. Aber wenn in den 20-30 Millisekunden zwischen den Bildern etwas passiert, könnte das System es übersehen. Eine Erhöhung der Bildrate könnte Abhilfe schaffen, würde aber mehr Datenverarbeitung und Rechenleistung erfordern.
Fortschrittliches Hybridkamerasystem innoviert
Ereigniskameras bieten einen anderen Ansatz, indem sie immer dann aufzeichnen, wenn sich etwas bewegt, so dass es keine blinden Flecken zwischen den Bildern gibt. Diese Spezialkameras arbeiten wie unsere Augen und erfassen kontinuierlich die Veränderungen in ihrer Umgebung. Obwohl sie viele Vorteile haben, haben sie Probleme mit sich langsam bewegenden Objekten und der Umwandlung ihrer Daten für das KI-Training.
Der Ansatz von Gehrig und Scaramuzza kombiniert das Beste aus beiden Welten. Sie verwenden eine Standardkamera, die 20 Bilder pro Sekunde aufnimmt, zusammen mit einem neuronalen Faltungsnetzwerk, um Objekte zu erkennen.
Gleichzeitig verarbeiten sie die Daten der Ereigniskamera mit einem fortschrittlichen neuronalen Netzwerk, das 3D-Daten im Laufe der Zeit analysieren kann. Dieses System hilft der Ereigniskamera bei der Vorhersage von Erkennungen und verbessert die Leistung der Standardkamera, ohne dass eine höhere Bildrate erforderlich ist.
Das Ergebnis ist ein Erkennungssystem, das so schnell wie eine Kamera mit 5.000 Bildern pro Sekunde arbeitet, aber nur die Datenmenge einer Kamera mit 50 Bildern pro Sekunde benötigt. Dies ist wichtig, um Objekte wie Autos und Fußgänger zu erkennen, die von normalen Kameras übersehen werden könnten, was das Fahren bei hoher Geschwindigkeit sicherer macht.
Die Forscher glauben, dass ihr System noch besser werden kann, indem sie LiDAR-Sensoren hinzufügen, die häufig in selbstfahrenden Autos verwendet werden, um die Erkennungsgenauigkeit und Zuverlässigkeit zu verbessern. Diese Verbesserung ist ein großer Schritt auf dem Weg, die Straßen für Fahrer und Fußgänger sicherer zu machen, und könnte dazu beitragen, die hohe Zahl der Autounfälle zu senken.