Ce TP consiste à implanter les modèles de conditionnement classique présentés dans cet article de Sutton et Barto.
Le modèle en question est constitué d'un seul perceptron : il est très simple et son implantation ne pose pas de problème ; la difficulté est plutôt de bien comprendre ce qu'il faut simuler à partir de la description faite dans l'article. On cherche à reproduire les résultats expérimentaux présentés dans l'article.
Ce modèle est décrit aux pages 4, 5 et 6 (pages numérotées 358 à 360).
Lisez ces pages de l'article et implantez le modèle (le perceptron tel qu'il est décrit dans ces pages par les équations (1), (2) et (3)).
Réalisez l'expérience et reproduisez la figure 2 de l'article. Prendre β = 0,9 et c = 0,1.
Ce modèle est décrit aux pages 6 à 8 (pages numérotées 361 à 363).
Le modèle est utilisé dans plusieurs expérimentations successivement décrites dans les pages 363 à 372.
Implantez le modèle TD et réalisez la première expérience ; reproduisez la figure 3.
Attention, prenez le temps de bien comprendre le protocole expérimental qui est différent de lui qui a été utilisé pour le modèle SB.
Remarque : le modèle à implanter est très ressemblant au modèle SB implanté précédemment.