Programmation dynamique pour la résolution d'un problème de décision de Markov

Plusieurs TP s'enchainent sous ce titre, à réaliser dans l'ordre :

  1. préliminaires,
  2. évaluation d'une politique,
  3. calcul d'une politique optimale.