Promotie F. de Nijs: Markov

04 april 2019 12:30 - Locatie: Aula, TU Delft - Door: webredactie

Resource-constrained Multi-agent Markov Decision Processes. Promotor 1: Dr. M.M. de Weerdt (EWI); Promotor 2: Dr. M.T.J. Spaan (EWI).

Intelligente en autonome agenten, ontwikkeld om meerdere aspecten van onze samenleving te automatiseren en makkelijker te maken, zullen steeds vaker autonoom met andere agenten moeten interacteren. Deze interacties tussen agenten zullen vaak over begrenzingen op hulpbronnen gaan. Agenten die huishoudelijke apparaten aansturen om zo gunstig mogelijk met elektriciteit om te gaan, zullen bijvoorbeeld rekening moeten houden met de maximale doorvoercapaciteit van het elektriciteitsdistributienetwerk.

Dit proefschrift stelt nieuwe algoritmen voor om het gedrag van agenten in begrensde omgevingen te optimaliseren, ook wanneer deze agenten moeten omgaan met significante onzekerheid over de effecten van hun acties op hun toestand. We stellen nieuwe algoritmen voor die de huidige stand van zaken vooruit brengen, door drie uitdagingen aan te vallen: het offline berekenen van statische toewijzingen, het online berekenen van dynamische (her)toewijzingen, en het optimaal leren van modeldynamiek door middel van bekrachtigend leren onder begrenzingen. Samengenomen laten deze algoritmen voor een brede groep condities zien hoe agenten hun gedrag kunnen coördineren onder onzekerheid en gedeelde beperkingen op hulpbronnen. Bovendien zijn de voorgestelde oplossingen complementair: statische toewijzingen kunnen ingezet worden als aanvullende strategie, voor het geval de communicatie wegvalt en dynamische toewijzing niet gebruikt kan worden.

Meer informatie?

Voor inzage in proefschriften van de promovendi kunt u kijken in de TU Delft Repository, de digitale vindplaats van openbare publicaties van de TU Delft. Proefschriften zullen binnen een paar weken na de desbetreffende promotie in de Repository te vinden zijn.