Reinforcement Learning

  Reinforcement Learning

Moderne Antriebe entwickeln sich zu elektrifizierten, vernetzten, softwareintensiven Systemen mit einer Vielzahl von Freiheitsgraden. Dies bedeutet auch eine enorme Zunahme der Systemkomplexität bei kürzeren Entwicklungszyklen und dadurch einen exponentiell steigenden Aufwand für die Entwicklung, Validierung und Kalibrierung von Softwarefunktion.

 

Ansprechpartner

Name

Kevin Badalian

Wissenschaftlicher Mitarbeiter

Telefon

work
+49 241 80 48181

E-Mail

E-Mail

Ansprechpartner

Name

Lucas Koch

Wissenschaftlicher Mitarbeiter

Telefon

work
+49 241 80 48105

E-Mail

E-Mail
 

Gegenwärtige Entwicklungsprozesse mit menschlich erstellter Software führen bei der steigender Variantenvielfalt und begrenzter Entwicklungskapazität zu suboptimalen Lösungen. Die hochgradig nichtlinearen Zusammenhänge zwischen einzelnen Komponenten, Stellgrößen, Parametern und Störeinflüssen sind selbst für ausgewiesene Experten schwierig zu erfassen und die entwickelten Funktionen sind in der Regel nicht ohne erheblichen Zusatzaufwand auf ähnliche Probleme anwendbar. Mit der begrenzten Verfügbarkeit von Fachpersonal führt dies zu ungenutztem Potential zur Effizienzsteigerung, welches durch maschinelles Lernen ausgeschöpft werden kann.

Die Auflösung des Zielkonflikts von Wirkungsgrad, Emissionen, Erfüllung des Fahrerwunsches und weiteren anwendungsspezifischen Zielgrößen wird am Institut für Mechatronik in mobilen Antrieben unter anderem durch Reinforcement Learning adressiert. Dieses maschinelle Lernverfahren basiert auf der Ableitung von optimalen Strategien zur Maximierung einer vorgegeben Belohnungsfunktion basierend auf Erfahrungen. Obwohl das grundsätzliche Potential dieser Methodik in zahlreichen Anwendungen bereits nachgewiesen wurde, wird Reinforcement Learning im Kontext der Antriebsstrangsoftware bisher nur äußerst begrenzt eingesetzt und stellt einen deutlichen Neuigkeitswert dar.

Um in frühen Entwicklungsphasen anwendungsnahe Trainingsumgebungen für die datenintensiven Algorithmen zu schaffen, bietet sich die Simulationsmethodik mittels X-in-the-Loop (XiL) Simulatoren an. Die Arbeiten am Institut erstrecken sich von der konzeptionellen Auslegung der Funktion über die Automatisierung des Trainingsprozesses in den verschiedenen XiL-Simulatoren bis hin zur Implementierung im realen Anwendungsfall.

 
 

Publikationen

Automated eco-driving in urban scenarios using deep reinforcement learning