Le renforcement.

Les méthodes acteurs-critiques.


Le renforcement est une technique d'optimisation dynamique stochastique. On parle aussi de méthode acteur, de méthode critique, ou de méthode acteur-critique. Basée sur les simulations, elle se développe rapidement par des succès certains sur des problèmes difficiles à traiter par programmation dynamique standard. Points forts:

Applications possibles :

Les options/algorithmes sont très nombreux: Le renforcement avec module d'extrapolation de type neuronal, appelé programmation neurodynamique, est à rapprocher du neurocontrôle.

Pour m'écrire