Retour

G-2025-07

Asymptotic normality of cumulative cost in linear quadratic regulators

, et

référence BibTeX

Le théorème central limite est un résultat fondamental en théorie des probabilités qui caractérise la distribution de l'écart par rapport à la moyenne dans la loi des grands nombres. Un comportement de distribution similaire apparaît dans d'autres cadres tels que l'estimation du maximum de vraisemblance, l'estimation des moindres carrés et l'approximation stochastique. Dans cet article, nous établissons un théorème central limite pour le coût cumulatif par étape engendré par la politique optimale dans les régulateurs linéaires quadratiques en utilisant les premiers principes. Notre technique de preuve repose sur une décomposition du coût cumulatif en utilisant un argument de complétion du carré, les propriétés de la séquence de bruit à densité uniforme, et un théorème central limite pour les séquences de différences martingales.

, 12 pages

Publication

, et
2024 63rd IEEE Conference on Decision and Control (CDC), Milan, Italy, 1856–1862, 2024 référence BibTeX

Document

G2507.pdf (380 Ko)