Veuillez trouver une offre de stage pour un étudiant de Master 2 ou en 3eme année d'école d'ingénieur. Dans la foulée, une thèse financée pourra débuter en
septembre 2023 dans la continuité du sujet de M2.
titre : Reinforcement learning techniques for Multi-agent path finding with imperfect information
encadrants :
Jilles Dibangoye, Ocan Sankur, François Schwarzentruber
durée : 6 mois
lieu : IRISA, Rennes
description :
https://epirl.irisa.fr/files/2022/10/m2proposal_rennes.pdf
Dans la thèse qui suit, on cherchera à faire le lien entre apprentissage par renforcement et logique épistémique (une logique modale pour exprimer des propriétés comme "un agent sait qu'un autre agent ne sait pas que..."), afin d'expliquer les décisions prises par les agents dans un cadre information imparfaite.
Cette annonce s’adresse à des étudiant.e.s en informatique, ayant un intérêt pour l'apprentissage par renforcement et la logique.
Merci de diffuser le plus largement auprès de vos étudiant.e.s.
Cordialement,
Jilles Dibangoye, Ocan Sankur, François Schwarzentruber
--------------------------------------------------------
François Schwarzentruber
maître de conférences à l'ENS Rennes
http://people.irisa.fr/Francois.Schwarzentruber/École normale supérieure de Rennes
Campus de Ker Lann
35170 Bruz
France
Tél : +33 2 99 05 93 23
Fax : +33 2 99 05 93 29
IRISA
Équipe LOGICA, bureau 218
Campus de Beaulieu
35042 Rennes Cedex
France
Tél : +33 2 99 84 71 11