Seminarankündigung
Reinforcement Lernen
WS 1998/99 wöchentlich. Genauer Termin wird noch bekanntgegeben.
Beginn: Erste Semesterwoche
Veranstalter: Paul Fischer, GB IV, Raum 332, Tel.4684
Beim Reinforcement Lernen untersucht man das folgende Szenario.
Ein Akteur kann mehrere Aktionen ausführen. Sobald er eine
Aktion ausgeführt hat, erhält er dafür eine Belohnung (reinforcement)
und kann die nächste Aktion ausführen usw.
Das Ziel ist es, die Aktionen so zu wählen, daß die Summe der
Belohnungen maximiert wird. Wenn nur endlich viele Aktionen
möglich sind und jeder eine feste Belohnung zugeordnet ist,
so muß man jede Aktion nur einmal durchführen, um eine mit maximaler
Belohnung zu finden. Interessanter ist diese Fragestellung, wenn
die Belohnungen stochastisch sind. Das heißt, zu jeder Aktion
gibt es mehrere mögliche Belohnungen, die jeweils mit bestimmten
Wahrscheinlichkeiten ausgegeben werden. Man muß nun eine Aktion mit
der größten durchschnittlichen Belohnung bestimmen. Dazu ist
es notwendig, alle Aktionen wiederholt zu testen, um eine beste
(mit hoher Wahrscheinlichkeit) herauszufinden. Da bei diesen Tests
auch schlechte Aktionen, also solche mit kleiner Belohnung, oft
ausgeführt werden, sinkt die durchschnittliche Belohnung.
Es geht also darum, Test-Strategien zu erlernen, die noch eine
hohe erwarete Belohnung garantieren.
Im Seminar werden zunächst die Grundlagen erarbeitet, die eine
Modellierung von Reinforcement-Lernprozessen erlauben. Dann wird
ein Überblick über die Methoden gegeben und es werden
verschiedene Lern-Strategien vorgestellt und analysiert.
Als Grundlage dienen das Buch Reinforcement Learning von Sutton und Barto,
MIT-Press, 1998 und Originalarbeiten.
Interessenten mögen sich bitte bei mir melden.
Fragen an: Paul Fischer
Last Update, 03-03-1998, Paul Fischer.