Tesla Patent "Machine learning models operating at different frequences for autonom vehicles"

von Eva Fox Juni 05, 2020

Tesla Filed Patent 'Machine learning models operating at different frequencies for autonomous vehicles'

Featured image: Tesla

Tesla hat es geschafft, die besten Spezialisten für künstliche Intelligenz in sein Autopilot-Team zu locken, das sich der Entwicklung von Software verschrieben hat, die das vollständige Selbstfahren ermöglicht.Das Unternehmen hat vor kurzem zwei Patente veröffentlicht, die sich auf Verbesserungen in diesem Bereich beziehen.


Tesla hat ein Patent für „Maschinenlernmodelle mit unterschiedlichen Frequenzen für autonome Fahrzeuge" im Dezember 3, 2019 und im Juni 4, 2020 veröffentlicht.Diese Anwendung bezieht sich im Allgemeinen auf das Sichtfeld der Maschine und insbesondere auf die verbesserte Objekterkennung von einem Fahrzeug.

Im Bereich der Bildverarbeitung für autonome Fahrzeuge sind die Bildsensoren (z.B. Kameras) in der Regel in der Lage, eine hohe Bildrate von 30-Frames pro Sekunde (fps) oder mehr zu erzielen.Allerdings können Tiefenlernalgorithmen nicht mit den hohen Kameraframeraten mithalten, ohne die Genauigkeit, Reichweite oder beides signifikant zu reduzieren.

Solche Algorithmen können bei 20-fps oder weniger ausgeführt werden.Dies kann zu einer Verschwendung der verfügbaren zusätzlichen Kamerainformationen führen, die somit nicht in der Bildverarbeitung und der Objekterkennung verwendet werden können.

Typischerweise können langsamere Maschinen-Lernmodelle (z.B. Objektdetektoren), die mit langsameren Frameraten als die Bildraten der Kameras laufen, hohe Genauigkeit haben, aber lange Latenzen, was bedeutet, dass es für diese langsameren Maschinen Lernmodelle länger dauern kann, um eine Ausgabe zu erzeugen.Die Ausgabe kann daher mit der Ausgabe veraltet werden.Ein langsameres Lernmodell, das ein Bild erkennt, kann beispielsweise 200-Millisekunden dauern.In den 200-Millisekunden braucht es für das Maschinenlernmodell, das erkannten Bild auszugeben, das Bild hat sich wahrscheinlich bewegt.

Um dies zu lösen, kann ein schnelleres Lernmodell eingesetzt werden.Das schnellere Lernmodell kann jedoch weniger präzise sein.Wie zu schätzen ist, kann eine geringere Genauigkeit zu einer höheren Wahrscheinlichkeit von falschen Negativen und falschen Positiven führen.Bei Automobilanwendungen kann beispielsweise ein falsches Negativ Fahrzeuge in einem Bild darstellen, das das Lernmodell nicht erkennt, während ein falsches Positiv ein Lernmodell darstellen kann, das ein Fahrzeug an einem Ort des Bildes vorhersagt, wenn es kein Fahrzeug gibt.

Embeddings der vorliegenden Erfindung beziehen sich auf Techniken für die autonome Führung oder Navigation durch ein Fahrzeug.Wie beschrieben kann ein oder mehrere Bildsensoren (z.B. Kameras) um ein Fahrzeug positioniert werden.Die Bildsensoren können Bilder bei einer oder mehreren Schwellenfrequenzen wie etwa 30 Frames pro Sekunde, 60 Frames pro Sekunde und so weiter erhalten.


FIG. 1 ist eine schematische Darstellung eines Beispielobjektdetektionssystems nach einer Ausführungsform.
Quelle: Tesla patent

Die gewonnenen Bilder können eine reale Einstellung darstellen, in der sich das Fahrzeug befindet.Als Beispiel kann das reale Umfeld andere Fahrzeuge, Fußgänger, Straßenverkehrsgefahren und dergleichen umfassen, die sich am Fahrzeug befinden.Das Fahrzeug kann daher die aufgenommenen Bilder nutzen, um sicherzustellen, dass das Fahrzeug sicher gefahren wird.


Quelle: Carrus Home

So kann das Fahrzeug beispielsweise Warnmeldungen für den Fahrer generieren.In diesem Beispiel kann eine Warnung darauf hindeuten, dass ein Fußgänger einen Kreuzgang überquert.Als weiteres Beispiel kann das Fahrzeug die Bilder benutzen, um autonom oder halbautonom zu informieren, das Fahrzeug zu fahren und/oder zu navigieren.

Die Maschinenlernmodelle können über ein System von einem oder mehreren Prozessoren, anwendungsspezifischen integrierten Schaltungen (ASICs) usw. implementiert werden.

Nach der vorliegenden Erfindung kann eine Objekterkennungsmethode Folgendes umfassen:

  • Empfang eines ersten Rahmens aus einer Kamera;
  • Verarbeitung des ersten Frames mit einer ersten Bildverarbeitungs-Engine, die einen zweiten Frame von der Kamera empfängt, während der erste Frame verarbeitet wird;
  • Senden der verarbeiteten Ausgabe des ersten Frames an eine zweite Bildverarbeitungs-Engine mit einer schnelleren Verarbeitungsgeschwindigkeit als die erste Bildverarbeitungs-Engine; Und
  • Kombination der verarbeiteten Ausgabe des ersten Frames mit dem zweiten Frame, um ein Objekterkennungsergebnis für den ersten Frame zu generieren.


2 ist ein Flussdiagramm eines Beispielverfahrens zur Objekterkennung nach einer Ausführungsform.
Quelle: Tesla-Patent

Die Methode funktioniert, um ein Bildverarbeitungssystem bereitzustellen, das mehrere Bildverarbeitungsmodule kombiniert, um Objekterkennungsausgänge mit einer Bildrate und Genauigkeit bereitzustellen, die viel höher ist, als es eine einzelne Bildverarbeitungs-Engine erreichen würde.

Systeme und Methoden umfassen Machine Learning-Modelle, die mit unterschiedlichen Frequenzen arbeiten. Das im Patent offenbarte Verfahren umfasst die Beschaffung von Bildern mit einer Schwellenfrequenz von einem oder mehreren Bildsensoren, die sich um das Fahrzeug befinden. Positionsinformationen, die Objekten zugeordnet sind, die in Bildern klassifiziert sind, werden anhand der Bilder ermittelt. Die Bilder werden mit dem ersten Schwellenfrequenz-Maschinell-Lernmodell analysiert.








← Vorheriger  / Nächster →