Algèbre max-plus et théorie de Perron-Frobenius non-linéaire
appliquées au contrôle optimal et aux jeux
Cours avancé, Parcours OJME, Année 06-07.
Volume prévu: 18h (6 séances de 3h).
L'étude de problèmes de contrôle optimal ou de jeux
par la méthode de la programmation dynamique
fait intervenir des opérateurs qui ont de fortes
propriétés de structure, telles que la préservation de l'ordre
d'un cône ou la contraction au sens large pour certaines
métriques (de Hilbert, de Thompson). Dans le cas particulier des problèmes
de contrôle déterministe, ces opérateurs
sont même linéaires, à condition de se placer
dans des structures algébriques dites max-plus
ou tropicales. L'étude de ces opérateurs s'inscrit
dans le cadre de la théorie de Perron-Frobenius non-linéaire,
qui étend certains des résultats connus pour les opérateurs
linéaires positifs préservant un cône.
Le but du cours est de présenter cette théorie,
en mettant en évidence ses aspects tropicaux, et
en l'appliquant à l'analyse
des problèmes de contrôle ou de jeux. On s'intéressera
particulièrement aux aspects asymptotiques (horizon
infini, problèmes ergodiques) et algorithmiques.
Semi-anneau max-plus et autres semi-anneaux tropicaux.
Problèmes où ces structures interviennent:
programmation dynamique; contrôle optimal
et équations d'Hamilton-Jacobi; problème
d'affectation optimale; problèmes asymptotiques.
Problème déterministe à espace d'état fini.
Représentation de l'espace propre.
Asymptotique de la fonction valeur et des stratégies
optimales lorsque l'horizon tend vers l'infini
(théorème ``du Turnpike''). Interprétation
des vecteurs propres en termes d'investissement,
ou comment éviter l'effet ``après nous le
déluge''. Généralisations: cas d'un espace d'état dénombrable (conditions de tension), cas des opérateurs compacts. Application aux semigroupes
d'Hamilton-Jacobi.
Applications monotones contractantes.
Applications monotones homogènes agissant sur un
cône. Exemples d'applications: problèmes de décision
Markoviens, jeux combinatoires,
problèmes de ``scaling'' (maximisation
d'entropie), dynamique des populations.
Métrique projective de Hilbert,
métrique de Thompson.
Problème spectral non-linéaire.
Généralisations non-linéaires du théorème de Perron-Frobenius:
questions d'existence et d'unicité du vecteur propre, convergence
vers une orbite périodique, structure de l'ensemble des points fixes.
Étude du problème de contrôle
stochastique avec critère ergodique.
Algorithme d'itération sur les politiques pour les jeux.
Cas actualisé. Cas avec gain moyen.
-
- 1
-
M. Akian and S. Gaubert.
Spectral theorem for convex monotone homogeneous maps, and ergodic
control.
Nonlinear Analysis. Theory, Methods & Applications,
52(2):637-679, 2003.
- 2
- M. Akian, R. Bapat, S. Gaubert,
``Max-plus algebras'',
in: Handbook of Linear Algebra, L. Hogben, R. Brualdi,
A. Greenbaum, and R. Mathias (editors),
Chapman & Hall, 2006 (in press).
- 3
-
F. Baccelli, G. Cohen, G.-J. Olsder, and J.-P. Quadrat.
Synchronization and linearity : an algebra for discrete events
systems.
New-York, 1992.
- 4
-
G. Cohen, S. Gaubert, and J.-P. Quadrat.
Duality and separation theorems in idempotent semimodules.
Linear Algebra and Appl., 379:395-422, 2004.
- 5
-
S. Gaubert and J. Gunawardena.
The Perron-Frobenius theorem for homogeneous, monotone functions.
Trans. of the AMS, 356(12):4931-4950, 2004.
- 6
-
V. N. Kolokoltsov and V. P. Maslov.
Idempotent analysis and applications.
Kluwer Acad. Publisher, 1997.
- 7
-
V. P. Maslov and S. N. Samborski
.
Idempotent analysis, volume 13 of Advances In Soviet
Mathematics.
Amer. Math. Soc., Providence, 1992.
- 8
-
R. D. Nussbaum.
Hilbert's projective metric and iterated nonlinear maps.
Memoirs of the AMS, 75(391), 1988.
Algèbre max-plus et théorie de Perron-Frobenius non-linéaire
appliquées au contrôle optimal et aux jeux
This document was generated using the
LaTeX2HTML translator Version 2002-2-1 (1.71)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html -split 0 courssg2
The translation was initiated by Stephane Gaubert on 2007-04-22
Notes
- ... Gaubert1
- INRIA, Domaine de Voluceau, 78153 Le Chesnay Cédex.
Stephane.Gaubert@inria.fr
Stephane Gaubert
2007-04-22