Seminarankündigung


Reinforcement Lernen


WS 1998/99 wöchentlich. Genauer Termin wird noch bekanntgegeben.


Beginn: Erste Semesterwoche
Veranstalter: Paul Fischer, GB IV, Raum 332, Tel.4684


Beim Reinforcement Lernen untersucht man das folgende Szenario. Ein Akteur kann mehrere Aktionen ausführen. Sobald er eine Aktion ausgeführt hat, erhält er dafür eine Belohnung (reinforcement) und kann die nächste Aktion ausführen usw. Das Ziel ist es, die Aktionen so zu wählen, daß die Summe der Belohnungen maximiert wird. Wenn nur endlich viele Aktionen möglich sind und jeder eine feste Belohnung zugeordnet ist, so muß man jede Aktion nur einmal durchführen, um eine mit maximaler Belohnung zu finden. Interessanter ist diese Fragestellung, wenn die Belohnungen stochastisch sind. Das heißt, zu jeder Aktion gibt es mehrere mögliche Belohnungen, die jeweils mit bestimmten Wahrscheinlichkeiten ausgegeben werden. Man muß nun eine Aktion mit der größten durchschnittlichen Belohnung bestimmen. Dazu ist es notwendig, alle Aktionen wiederholt zu testen, um eine beste (mit hoher Wahrscheinlichkeit) herauszufinden. Da bei diesen Tests auch schlechte Aktionen, also solche mit kleiner Belohnung, oft ausgeführt werden, sinkt die durchschnittliche Belohnung. Es geht also darum, Test-Strategien zu erlernen, die noch eine hohe erwarete Belohnung garantieren.

Im Seminar werden zunächst die Grundlagen erarbeitet, die eine Modellierung von Reinforcement-Lernprozessen erlauben. Dann wird ein Überblick über die Methoden gegeben und es werden verschiedene Lern-Strategien vorgestellt und analysiert.

Als Grundlage dienen das Buch Reinforcement Learning von Sutton und Barto, MIT-Press, 1998 und Originalarbeiten.

Interessenten mögen sich bitte bei mir melden.


Fragen an: Paul Fischer
Last Update, 03-03-1998, Paul Fischer.