Programmation dynamique pour la résolution d'un problème de décision de Markov
Plusieurs TP s'enchainent sous ce titre, à réaliser dans l'ordre :
préliminaires
,
évaluation d'une politique
,
calcul d'une politique optimale
.